人 
久 半 
者 


从 认 知 的 视角 来 研究 计算 语言 学 ， 特 别 是 中 文 信息 处 理 的 
问题 。 对 有 兴趣 了 解 或 从 事 计 算 语言 学 研究 的 人 很 有 启迪 意义 。 

从 认 知 的 角度 研究 了 汉语 的 论 元 结构 和 描述 框架 ， 并 进行 
了 真实 文本 语义 标注 的 实践 。 

结合 作者 自己 的 研究 实践 讨论 说 明了 基于 认 知 并 面向 计算 
的 汉语 语法 研究 的 路 线 ， 展 示 了 认 知 语言 学 和 计算 语言 学 相互 结 


合 的 可 能 性 。 


N 978-7-3501-14052-9 


7350111405 
”定价 : 30. 00 元 


基于 认 知 的 
议 语 计算 语言 学 研究 


袁 鲸 林 著 


@ 供 j 北 去 上 学 出 版 社 


Nusogt PEKING UNIVERSITY PRESS 


图 书 在 版 编目 (CIP) 数 据 


基于 认 知 的 汉语 计算 语言 学 研究 / 袁 航 林 著 . 一 北京 : 


版 社 ,2008.7 


ISBN 978-7-301-14052-9 


T， 基 … 


开 . 喜 … 亚 . 汉语 -机 器 翻译 -研究 


中 国 版 本 图 书馆 CIP 数据 核 字 (2008) 第 103402 号 


书 名 : 
著作 责任 者 : 
责任 编辑 : 
号 : IJSBN 978-7-301-14052-9/H。2028 
出 版 发 行 : 
地 址 : 
: http:Wcbs. pku. edu. cn 


标准 书 


定 价 : 


基于 认 知 的 汉语 计算 语言 学 研究 
圳 航 林 “ 著 
杜 若 明 


北京 大 学 出 版 社 
北京 市 海淀 区 成 府 路 205 号 100871 


: Zpup@Ppup. pku. edu. cn 
: 邮购 部 62752015 ”发 行 部 62750672 ”编辑 部 62752028 


出 版 部 62754962 


: 北京 大 学 印刷 厂 
: 新 华 书店 


北京 大 学 出 


也 085 


890 毫米 X1240 毫米 A5 15.125 印张 335 千 字 


2008 年 7 月 第 1 版 2008 年 7 月 第 1 次 印刷 
30. 00 元 


未 经 许可 ,不 得 以 任何 方式 复制 或 抄袭 本 书 之 部 分 或 全 部 内 容 。 
版 权 所 有 ,侵权 必 究 


举报 电话 : (010)62752024 


电子 信箱 : fdQ@pup. pku. edu. cn 


陆 。 序 


在 学 术 研 究 领域 , 袁 航 林 可 以 说 是 一 位 勤奋 的 耕耘 者 。 他 的 论 
文集 4 汉语 语法 研究 的 认 知 视野 兴 商 务 印 书馆 ) 于 2004 年 出 版 ,现在 
又 推出 了 新 的 论文 集 ( 基 于 认 知 的 汉语 计算 语言 学 研究 》。 我 大 略 地 
翻阅 了 二 下 全 书 各 篇 的 内 容 , 论 文集 的 书 名 “基于 认 知 的 汉语 计算 语 
言 学 研究 ”;, 点 明了 该 书 的 基本 内 容 一 一 从 认 知 的 视角 来 研究 计算 语 
言 学 ,特别 是 中 文 信息 处 理 的 问题 。 正 文具 体 分 四 部 分 内 容 : 

第 一 部 分 内 容 , 作 者 取 名 为 “计算 理论 和 语言 研究 ,包括 四 篇 文 
章 :《 计 算 语 言 学 的 理论 方法 和 研究 取向 》《 基 于 统计 的 语言 处 理 模 型 
的 有 用 性 和 局 限 性 》《 认 知 科学 和 汉语 计算 语言 学 》 和 《面向 当代 科技 
的 语言 研究 的 理论 和 方法 》。 计 算 语 言 学 的 研究 ,大 致 可 以 分 为 两 个 
层面 ,一 个 是 理论 模型 的 研究 ,一 个 是 工程 研究 (或 说 具体 的 技术 方法 
研究 ) 。 据 我 所 知 , 喜 艇 林 主 要 从 事理 论 模型 的 研究 ,所 以 这 一 部 分 内 
容 作者 主要 从 宏观 的 角度 介绍 说 明了 计算 语言 学 的 理论 方法 和 研究 
取向 ;评述 了 在 自然 语言 处 理 中 已 运用 过 的 基于 规则 和 基于 统计 的 两 
种 处 理 模型 ,指出 处 理 语言 这 种 复杂 的 系统 “必须 走 规则 和 统计 相 结 
合 的 道路 ;从 认 知 科学 的 视角 作者 把 自己 认为 有 价值 的 并 且 是 可 行 
的 计算 语言 学 研究 模式 介绍 给 读者 ,并 结合 作者 自己 的 研究 实践 讨论 
说 明了 基于 认 知 并 面向 计算 的 汉语 语法 研究 的 路 线 ; 展 示 了 认 知 语言 
学 和 计算 语言 学 相互 结合 的 可 能 性 。 这 部 分 内 容 对 有 兴趣 了 解 或 从 
事 计算 语言 学 研究 的 人 来 说 ,是 值得 一 读 的 ,是 很 有 启迪 意义 的 。 

第 二 部 分 内 容 , 作 者 取 名 为 “ 论 元 结构 和 描述 框架 ”, 也 包括 四 篇 
文章 :《 论 元 角色 的 层级 关系 和 语义 特征 》《 一 套 汉 语 动 词 的 论 元 角 
色 的 语法 指标 》《 汉 语 谓词 的 论 元 结构 的 描述 框架 》 和 《 论 元 结构 和 
句 式 结构 互动 的 动因 、 机 制 和 条 件 一 一 表达 精细 化 对 动词 配 价 和 句 式 构 
造 的 影响 》。 喜 艇 林 是 我 国 最 早 研究 配 价 问题 的 学 者 之 一 ,特别 是 他 
第 一 个 发 表 了 有 关 汉 语 名 词 配 价 的 研究 成 果 , 该 成 果 被 广 为 引 用 。 
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以 乔 姆 斯 基 为 代表 的 生成 语法 学 派 所 提出 的 动词 论 元 结构 理论 与 法 
国 依存 语法 学 派 特 斯 尼 耶 尔 提 出 的 动词 配 价 结构 理论 有 相同 的 一 
面 , 当 然 出 发 点 不 同 ,思考 的 角度 不 同 * 对 语言 事实 解释 的 广度 与 深 
度 也 不 同 。 十 多 年 来 圳 艇 林 一 直 致 力 于 动词 论 元 结构 的 研究 ,在 这 
方面 他 发 表 了 一 系列 有 分 量 的 文章 。 我 所 主持 的 两 个 重大 科研 项 目 
“面向 中 文 信息 处 理 的 现代 汉语 动词 论 则 结构 系统 和 汉语 词语 语义 
分 类 层级 系统 研究 ”( 国 务 院 973 国家 重点 基础 研究 发 展 规划 项 目 
“图 像 .语音 自然 语言 理解 与 知识 挖掘 ” 子 课题 ) 和 “汉语 语义 知识 
的 形式 化 模型 及 语义 分 类 系统 研究 ”( 教 育 部 重点 研究 基地 项 目 ) 圳 
艇 林 都 参加 了 ,其 中 的 “汉语 动词 的 题 元 系统 及 其 语法 指标 ”2( 包 括 
“ 题 元 的 层级 体系 ”, “各 别 题 元 的 定义 ` 示例 和 名 法 语义 特点 >, 不同 
题 元 之 间 的 配合 关系 ”以 及 “各 别 题 元 的 语法 指标 习 就 是 由 圳 航 林 
执笔 起 草 的 。 因 此 本 书 这 一 部 分 内 容 可 以 说 是 他 对 自己 在 配 价 问 题 
和 动词 论 元 结构 研究 方面 成 果 的 汇集 。 在 这 部 分 内 容 中 ,他 不 仅 建 
立 并 提出 了 汉语 动词 论 元 角色 的 层级 体系 ,定义 了 各 个 语义 角色 ,并 
细致 描述 了 各 个 语义 角色 在 述 谓 结 构 中 所 表现 出 来 的 动态 性 语义 特 
征 , 同 时 通过 十 个 各 具 特 色 ` 有 代表 性 的 实例 (谓词 “ 切 : 包 ;、 包 ; 调 
查 、 帮 忙 ;、 帮 忙 。、 飞 |、 飞 ，、 吃 专政 ”) 给 出 了 谓词 及 其 论 元 的 句法 配 
置 方式 ,提出 了 汉语 谓词 论 元 结构 的 描写 框架 。 更 值得 注意 的 是 ,他 
探讨 了 谓词 论 元 结构 和 和 句 式 结构 (constructions) 互 动 的 动因 机 制 
和 条 件 ,对 汉语 谓词 上 所谓“ 变价? 和“ 论 元 增 容 ” 作 了 进一步 的 解释 。 
第 三 部 分 内 容 , 作 者 取 名 为 “信息 抽取 和 语义 标注 罗 包括 五 篇 文 
章 :《 信 息 抽取 的 语义 知识 资源 研究 》《 用 动词 的 论 元 结构 跟 事 件 模 板 
相 匹 配 一 一 一 种 由 动词 驱动 的 信息 抽取 方法 》《 用 逻辑 和 篇 章 知识 来 约束 
模板 匹配 一 一 多 辑 结构 和 篇 章 结构 知识 在 信息 抽取 中 的 运用 》 愉 基于 论 元 结 
构 的 语义 标注 的 体系 和 规范 以 及 《新 闻 语 体 真 实 文本 的 语义 标注 的 
实践 》。 这 部 分 内 容 作者 主要 提出 并 举例 说 明了 要 使 计算 机 有 效 地 自 
动 从 真实 文本 抽取 信息 至少 要 有 三 种 层面 的 语义 知识 : 话语 篇 章 知 
识 .谓词 论 元 结构 知识 和 句子 的 逻辑 结构 知识 ;为 对 真实 文本 进行 语 
义 分 析 和 标注 ,作者 细致 分 析 设 计 了 篇 章 、 谓 词 论 元 结构 .句子 逻辑 结 
构 这 三 种 层面 各 自 的 语义 关系 ,并 为 这 三 种 层面 各 自 的 语义 关系 设计 
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并 提出 了 一 套 可 扩充 的 标记 集 ; 作 者 还 以 自己 设计 的 这 套 标 记 对 新 闻 
报道 中 关于 职务 调动 的 真实 文本 进行 了 语义 关系 标注 实践 。 作 者 标 
注 得 相当 认真 。 通 过 这 样 的 标注 实践 又 有 所 发 现 一 一 真实 文本 中 代 
词 或 指示 词 的 先行 成 分 (一 般 称 为 先行 语 ) 常 常 是 隐 含 的 ;段落 之 间 的 
衡 接 ,其 形式 手段 相当 缺乏 。 这 就 促使 大 家 去 进一步 思考 、 探 索 怎 女 
为 计算 机 自动 处 理 真实 文本 解决 这 方面 的 难题 。 

第 四 部 分 内 容 , 作 者 取 名 为 “专题 研究 和 个 案 分 析 ”, 也 包括 五 篇 
文章 :《 容 器 隐喻 和 套件 隐喻 及 相关 的 语法 现象 一 词语 同 现 限制 的 
认 知 解释 和 计算 分 析 》《 关 于 分 词 规范 和 规范 词 表 的 若干 意见 》 尺 中 文 
言 息 处 理 中 的 语言 难题 问答 》《 缓 冲 式 移动 通信 及 其 发 展 方向 
一 个 语言 学 家 的 设计 思想 》 和 《走向 多 层面 互动 的 汉语 研究 》。 这 部 分 值 
得 细 细 阅读 的 是 《容器 隐喻 和 套件 隐喻 及 相关 的 语法 现象 一 一 词语 
同 现 限制 的 认 知 解 释 和 计算 分 析 》 和 《走向 多 层面 互动 的 汉语 研究 》 这 两 
篇 文章 。 前 一 篇 文章 主要 通过 对 “ 满 ”*“ 全 ”, 特 别 是 “ 满 十 NE 全 
十 NP? 在 意义 .用 法 上 的 不 平行 性 的 解释 ,说 明 语 言 中 的 许多 现象 只 
有 从 认 知 的 隐喻 的 视角 来 加 以 解释 一 一 用 容器 隐喻 来 解释 “ 满 背 后 
的 概念 结构 以 及 由 * 满 ”构成 的 “ 满 十 NP?” 的 使 用 特点 ,用 套件 隐喻 来 
解释 “全 ”背后 的 概念 结构 以 及 由 “全 ”构成 的 “全 十 NP” 的 使 用 特点 ， 
这 样 才能 说 得 清楚 ,说 得 圆满 ,说 得 充分 ,才能 有 解释 力 ;通过 对 “ 满 ” 
和 “全 ”又 具有 一 定 的 可 替换 性 的 解释 ,说 明 隐 喻 分 析 有 必要 提升 到 
更 为 抽象 的 意象 图 式 水 平 ,这 样 才 更 有 解释 力 ,才能 最 终 解 释 说明 既 
然 “ 满 ”>…“ 全 ”背后 的 概念 结构 是 属于 不 同 的 隐喻 范畴 ,为 什么 有 时 又 
具有 可 替换 性 ; 即 才能 说 明 为 什么 容器 隐喻 和 套件 隐喻 在 语言 的 实 
际 使 用 中 会 出 现 三 者 中 和 化 的 现象 ;更 积极 的 意义 ,还 在 于 正如 作者 
在 文章 中 所 指出 的 ,有 助 于 语言 的 认 知 解释 有 可 能 实现 形式 化 和 可 
计算 ;从 而 有 可 能 实现 认 知 和 计算 的 统一 (“ 有 可 能 ”三 个 字 不 是 作者 
说 的 ,是 我 加 的 )。 后 一 篇 文章 是 作者 为 徐 杰 所 编 的 4 词汇 语法 语音 
的 相互 关联 一 一 第 二 届 肯 特 岗 国际 汉语 语言 学 圆桌 会 议 (2002. 11. 
26 一 30. ) 论 文集 ;所 写 的 代 前 言 。 文 章 扼 要 回顾 了 20 世纪 汉语 研究 
的 历史 ,对 今后 的 汉语 研究 发 表 了 很 有 见地 的 看 法 .作者 强调 指出 ， 
汉语 研究 必须 树立 “互动 观念 ”, 走 多 层面 互动 研究 之 路 ,而 这 方面 正 
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是 目前 汉语 学 界 所 缺乏 的 。 文 章 特别 谈 到 了 一 段 时 间 来 成 为 人 们 热 
门 话题 的 所 谓 “ 语 法 研究 三 个 平面 ?的 问题 ,作者 强调 指出 “我 们 不 
仅 应 该 分 清 语 法 的 三 个 不 同 的 平面 ,而 且 应 该 观察 这 三 个 不 同 的 平 
面 之 间 的 互动 关系 ”, 并 应 “引入 语言 类 型 学 的 视野 ”,“ 引 进 语法 化 这 
种 动态 性 的 概念 ,来 审视 语法 .语义 和 语 用 这 三 个 平面 之 间 的 互动 关 
系 ”，“ 从 而 打破 共 时 研究 和 历时 研究 之 间 的 藩 篇 ,把 语言 的 共 时 研究 
和 历时 研究 沟通 起 来 ”>, 以 “推动 语言 研究 走向 更 为 全 面 、 综 合 和 多 层 
面 互动 的 道路 ”。 文 章 以 学 界 已 有 的 研究 成 果 和 作者 本 人 的 研究 成 
果 具 体 说 明了 语法 和 语音 之 间 、` 词 库 结 构 和 句法 操作 之 间 的 互动 关 
系 , 以 及 这 种 互动 所 应 有 的 限度 。 这 是 很 有 见地 的 看 法 ,应 引起 大 家 
重视 。 

我 虽然 只 粗 粗 阅读 了 一 遍 , 觉 得 收获 良 多 ,推荐 大 家 一 读 。 借 此 
机 会 我 也 想 发 表 两 点 看 法 ,同时 也 想 提 出 一 些 意 见 。 

第 一 点 ,当今 语言 研究 的 走向 之 一 ,确实 如 本 书 作者 所 说 ,要 走 
多 层面 互动 的 研究 之 路 。 不 过 这 只 是 “之 一 ”, 还 应 有 另 一 个 “之 一 ”， 
那 就 是 “特征 研究 ”, 这 也 必须 重视 。 从 上 个 世纪 七 十 年 代 以 来 ,就 语 
言 研究 说 ,一 个 重要 的 趋向 是 逐步 重视 特征 的 研究 和 描写 。 在 语言 
的 理论 研究 和 应 用 研究 上 都 是 这 样 。 

先 说 语言 的 理论 研究 ,大 家 知道 ,在 语言 研究 领域 ,最 早 讲 特征 
的 是 音 位 学 ,接着 是 语义 学 ;语法 学 里 讲 语义 特征 那 是 七 十 年 代 以 后 
的 事 了 。 当 时 把 “语义 特征 ?这 个 概念 术语 借用 到 语法 学 中 ,为 的 是 
做 两 件 事 : 一 件 事 ,用 以 解释 造成 同形 多 义 句 法 格式 的 原因 ; 另 一 件 
事 , 用 以 说 明 在 某 个 句法 格式 中 ,为 什么 同 是 动词 ,或 同 是 形容 词 ,或 
同 是 名 词 ,而 有 的 能 进入 ,有 的 不 能 进入 。 发 展 到 乔 姆 斯 基 的 生成 语 
法 理论 ,特征 又 赋予 它 新 的 含义 。 我 们 知道 , 乔 姆 斯 基因 为 认为 结构 
主义 对 语言 的 描写 所 概括 的 规则 太 复 杂 了 ,所 以 他 要 提出 生成 语法 
的 观点 ,以 简化 语法 规则 。 简 约 ,一 直 是 生成 语法 学 的 一 个 很 重要 的 
原则 。 从 1957 年 的 由 核心 句 到 非 核心 句 的 转换 ,到 1964 年 的 从 深 
层 结构 到 表层 结构 的 转换 ,到 上 个 世纪 80 年 代 初 的 GB 理论 一 一 只 
剩 下 “va 移 位 ?规则 ,其 他 都 成 了 原则 ,再 到 最 简 方 案 及 其 近 几 年 的 论 
述 一 一 众多 的 原则 和 移 位 规则 基本 都 不 要 了 ,D- 结 构 ,S- 结 构 都 没有 
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了 , 似 只 保留 了 “原则 和 参数 ?理论 和 “X-bar?” 结 构 模 式 , 进 一 步 强调 
经 济 原则 ;而 提出 了 中 心 词 (head) 理论 和 特征 核查 (feature chec- 
king) 理 论 , 以 及 轻 动词 理论 和 VP 空 壳 理 论 , 注 入 了 新 的 研究 课 
题 一 一 接口 Cinterfaces) 的 研究 。 基 本 的 句法 运作 是 从 基础 部 分 ( 即 
词 库 ) 取 出 带 有 各 种 各 样 的 有 关 语 义 、 句 法 特征 的 词 项 ,进行 来 回合 
并 (Merge) ,如 能 通过 特征 核查 ( 指 中 心 语 跟 标示 语 , 中 心 语 跟 补足 
语 , 在 特征 上 吻合 ), 由 此 生成 的 词 项 组 合 再 去 跟 音 韵 接口 , 跟 逻 辑 语 
义 接 口 , 从 而 最 终生 成 我 们 所 听 到 或 看 到 的 句子 。 总 之 ,词语 的 特征 
的 分 析 和 描写 放 到 了 非常 重要 的 位 置 , 走 上 了 “大 词 库 ,小 规则 ”之 
路 。 这 里 要 附带 说 明 的 ,最 近 乔 姆 斯 基 在 Linguistic Inquiry 杂志 
2005 年 第 1 期 上 发 表 的 文章 (Three Factors i Lazzguage Desig7.) 
中 似乎 提 到 要 取消 “特征 核查 ,但 他 同时 在 文章 中 认为 ,从 词 库 选 出 
词语 项 ,构成 词语 序列 ,形成 语 段 后 ,要 通过 所 谓 “ 探 针 (Cprobe) ”与 目 
标 进行 相互 核查 ,如 果 没 有 发 现 不 可 诠释 的 特征 ,就 转移 给 语音 和 语 
义 两 个 界面 接口 ,由 此 获得 语音 和 语义 相 结合 的 语言 形式 。 这 实质 
上 还 是 需要 进行 特征 核查 这 一 步骤。 而 所 谓 “ 要 取消 特征 核查 罗 我 
体会 是 指 在 操作 手续 上 要 进一步 简化 。 

现在 再 看 自然 语言 处 理 与 理解 这 方面 的 语言 应 用 研究 。 大 家 都 
知道 ,自然 语言 处 理 与 理解 最 早 使 用 规则 的 方法 来 实行 计算 机 对 名 
子 的 理解 与 生成 ,结果 不 成 功 ; 于 是 提出 用 统计 的 办 法 ,用 语料库 让 
计算 机 自己 通过 对 上 万 上 亿 字 语 料 的 “学 习 ” 来 实行 计算 机 对 句子 的 
理解 与 生成 。 结 果 也 不 理想 。 现 在 较为 普遍 地 采用 了 Pollard 芭 
Sag (〈J7z formaatizoz Basecd Syztiaz aa Seaazztics。The University of 
Chicago Press，Chicago. 1987) 所 提出 的 中 心 语 驱动 短语 结构 文 
法 一 一 中 心 语 驱 动 短语 结构 文法 的 规则 都 是 围绕 中 心 语 展开 的 ,而 
其 最 基础 的 普遍 通用 的 原则 是 中 心 语 特征 原则 ,同时 采用 复杂 特征 
(complex feature set) 和 合 一 (Cunification) 运 算 的 方法 来 实行 计算 机 
对 句子 的 理解 与 生成 ,基本 道理 跟 乔 姆 斯 基 的 特征 核查 是 一 样 的 ,最 
终 也 走 上 了 "大 词 库 ,小 规则 ?的 所 谓 “ 词 汇 主义 ?(lexicalism) 之 路 。 

语言 的 理论 研究 和 应 用 研究 殊途同归 ,最 终 走 到 一 条 路 上 去 ,这 绝 
非 偶 然 的 巧合 。 他 们 是 相互 影响 的 结果 。 上 面 说 了 ,本 书 作者 在 第 一 部 
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分 内 容 里 ,主要 从 宏观 的 角度 介绍 说 明了 计算 语言 学 的 理论 方法 和 研究 
取向 ,但 作者 未 注意 到 “重视 特征 研究 ”这 一 取向 ,这 可 能 跟 作者 对 于 国 
外 近 十 多 年 来 有 关 计 算 语言 学 方面 的 文献 资料 还 了 解 得 不 全 面 有 关 。 

第 二 点 ,上 面 说 了 ,作者 在 第 二 部 分 内 容 里 ,探讨 了 谓词 论 元 结构 
和 名 式 结构 (constructions,' 有 人 说 成 “ 构 式 ”互动 的 动因 、 机 制 和 条 件 ， 
对 汉语 谓词 所 谓 “ 变 价 ” 和 “ 论 元 增 容 ” 作 了 进一步 的 解释 。 论 述 很 有 
新 意 。 但 我 觉得 如 果 作 者 能 进一步 深入 思考 这 样 一 个 问题 就 好 了 : 
“人 对 客观 事物 的 感知 所 得 最 后 是 怎样 用 言辞 表达 出 来 的 ?最 近 看 到 
王 黎 在 《关于 构 式 和 词语 的 多 功能 性 》(《 外 国语 》2005 年 第 4 期 ) 一 文 
中 明确 提出 了 这 个 问题 。 王 黎 认为 ,从 人 对 客观 事物 的 感知 所 得 到 最 
后 用 言辞 表达 出 来 ,中 间 一 共 可 分 为 五 个 层面 : 第 一 层 : 是 客观 世界 
中 所 存在 的 诸多 基本 的 .典型 的 事件 (包括 景象 等 ) ,诸如 “存在 事件 ” 
“分 配 事件 >"“ 事 物 特征 ?等 (用 王 表 示 )3; 第 二 层 : 这 个 事件 ,如 存在 事 
件 , 被 人 观察 到 以 后 ,就 相应 地 在 人 的 认 知 域 里 ,形成 了 存在 意象 (im- 
age 用 工 表示 ) ;第 三 层 : 这 存在 意象 又 激活 了 人 脑 里 的 深层 存在 意义 
框架 (用 下 表示 ) ;第 四 层 : 当 这 个 深层 存在 意义 框架 被 位 于 表层 的 语 
言 表 现 出 来 时 ,就 有 了 存在 构 式 (用 CG 表 示 ); 第 五 层 : 那 存在 构 式 里 填 
上 一 定 的 具体 的 词 项 ,就 形成 我 们 在 实际 语言 交际 中 所 听 到 看 到 的 存 
在 名 (用 S 表示 )。 这 五 个 层面 的 关系 , 王 黎 图 示 如 下 : 


| 第 二 层 ,“ 存在 "事件 (E) 
第 二 层 : 0 ea 
全 和 5 
第 四 层 ， se 


Y 
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第 五 层 :“ 存 在 ”句子 (S) 


陆 序 4 


这 当然 是 一 种 假设 ,不 能 看 作 是 结论 ,但 可 引起 人 们 去 进一步 思 
考 。 同 时 ,可 以 用 来 更 好 的 解释 说 明 句 式 的 配 价 问题 ,也 可 以 对 汉语 
谓词 所 谓 “ 变 价 ” 和 ”* 论 元 增 容 ” 作 出 更 好 的 解释 。 

袁 久 林 论文 集 编 就 后 ,要 我 写 序 , 这 已 是 数 个 月 之 前 的 事 了 。 写 
序 ,还 是 应 尽 可 能 做 到 有 的 放 矢 ,实事 求 是。 所 以 我 在 动笔 写 之 前 ， 
一 定 要 先 看 书稿 ,了 解 全 书 内 容 。 我 又 比较 忙 , 这 样 就 拖 到 现在 才 将 
序 文 草 就 。 所 言 不 一 定 到 位 ,请 作者 和 广大 读者 批评 指正 。 是 为 序 。 


陆 俭 明 
2007-10-08 于 北京 蓝 旗 营 富 所 


读 了 豆角 林 教授 新 著 的 文集 (基于 认 知 的 汉语 计算 语言 学 研 
究 》; 使 我 联想 到 美国 著名 人 工 智 能 专家 T，Winograd 在 1983 年 写 
的 专著 《作为 认 知 过 程 的 语言 》(Largxvage as a Cogmaztive Process ) 。 
这 两 本 书 都 试图 从 认 知 的 角度 来 研究 计算 语言 学 的 问题 。 可 异 
Winograd 的 专著 只 写 了 “句法 ”(Syntax) 部 分 ,没有 再 继续 往 下 写 。 
几 年 以 前 ,我 在 国外 曾经 遇见 Winograd, 问 他 为 什么 不 继续 写 “ 语 义 
学 ”(Semantics) 部 分 ,他 回答 说 ,语义 学 太 复杂 ,不 打算 继续 写 下 去 
了 。 这 样 《 作 为 认 知 过 程 的 语言 ?这 本 专著 可 以 说 只 是 写 了 一 半 , 就 
半途 而 废 了 。 从 Winograd 的 学 识 和 才气 来 说 ,他 是 完全 可 以 继续 
写 下 去 的 ;可 是 他 没有 继续 写 ,我 感到 非常 之 可 惜 。 氏 林 的 这 本 文 
集 , 着 重 从 认 知 的 角度 探讨 论 元 结构 和 语义 标注 ,基本 上 都 是 语义 的 
问题 ,恰好 弥补 了 Winograd 专著 的 不 足 , 令 我 感到 兴奋 。 
T.，Winograd 在 他 的 专著 中 说 ,为 了 从 认 知 的 角度 来 研究 语言 ， 
应 该 解决 如 下 两 个 问题 : 
第 一 ， 一 个 人 要 说 话 和 理解 语言 ,必须 具有 哪些 知识 ? 
第 二 ， 为 了 在 语言 交际 中 使 用 这 些 知 识 , 人 们 的 心智 
Cmind) 是 怎样 组 织 这 些 知 识 的 ? 
根据 研究 计算 语言 学 多 年 的 实践 经 验 ,一 个 人 在 说 话 和 理解 语 
言 时 ,不 仅 需要 关于 语言 的 知识 ,而 且 还 需要 各 种 非 语言 的 知识 , 例 
如 关于 外 在 世界 的 知识 .日 常生 活 中 的 常识 等 ,这 已 经 是 不 容 争 论 的 
问题 。 事 实 上 ,计算 语言 学 研究 者 也 在 努力 把 这 些 知识 形式 化 ,以 便 
计算 机 处 理 。 但 是 ,要 了 解 人 们 的 心智 究竟 怎样 组 织 这 些 知识 , 却 是 
一 个 十 分 困难 的 问题 。 认 知 语言 学 试图 解决 这 样 的 问题 。 
认 知 语言 学 是 20 世纪 80 年 代 才 出 现 的 语言 学 科 , 如 果 把 1989 
年 在 德国 Duisburg 召开 的 国际 第 一 届 认 知 语言 学 会 议 作 为 认 知 语 
言 学 诞生 的 标志 ,那么 ,这 门 学 科 至 今 才 有 短 短 19 年 的 历史 ,可 以 说 
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是 非常 年 轻 的 学 科 。 其 实 ,在 认 知 语言 学 产生 之 前 ,很 早 就 有 人 提出 
了 通过 语言 来 揭示 人 类 心智 的 问题 ,已 经 涉及 到 认 知 语言 学 的 问题 
1933 年 ,英国 数学 家 AM. Turing 就 预见 到 未 来 的 计算 机 将 会 对 
自然 语言 研究 提出 新 的 问题 。 他 在 《机 器 能 思维 吗 》 一 文中 指出 : 
“我 们 可 以 期 待 , 总 有 一 天 机 器 会 同人 在 一 切 的 智能 领域 里 竞争 起 
来 。 但 是 ,以 哪 一 点 作为 竞争 的 出 发 点 呢 ? 这 是 二 个 很 难 决定 的 问 
题 。 许 多 人 以 为 可 以 把 下 棋 之 类 的 极为 抽象 的 活动 作为 最 好 的 出 发 
点 ,不 过 ,我 更 倾向 于 支持 另 一 种 主张 ,这 种 主张 认为 ,最 好 的 出 发 点 
是 制造 出 一 种 具有 智能 的 、 可 用 钱 买 到 的 机 器 ;然后 , 教 这 种 机 器 理 
解 英 语 并 且说 英语 。 这 个 过 程 可 以 仿效 小 孩子 说 话 的 那 种 办 法 来 进 
行 .”Turing' 提 出 ,检验 计算 机 智能 高 低 的 最 好 办 法 是 让 计算 机 来 
讲 英语 和 理解 英语 ,他 天 才 地 预见 到 计算 机 和 自然 语言 将 会 结 下 不 
解 之 缘 。 我 认为 ,Turing 这 种 预见 的 实质 ,就 是 提出 了 “语言 是 认 知 
的 窗口 ”的 这 个 重要 命题 。 这 个 命题 是 认 知 语言 学 的 基础 。 所 以 ,从 
认 知 的 角度 来 研究 计算 语言 学 ,进行 “基于 认 知 的 汉语 计算 语言 学 研 
究 ”, 是 非常 必要 的 。 

航 林 在 这 本 文集 中 ,从 认 知 的 角度 研究 了 汉语 的 论 元 结构 和 描 
述 框架 ,并 进行 了 真实 文本 语义 标注 的 实践 ,使 我 们 对 于 汉语 的 论 元 
结构 有 了 更 加 深刻 的 认识 。 

在 20 世纪 70 年 代 末 和 80 年 代 初 ,我 在 法 国 格 勒 诺 布尔 理 科 医 
科大 学 研制 汉 - 法 / 英 /日 / 俄 / 德 多 语言 机 器 翻译 系统 RAJRA 时 ,就 
根据 Tesniars 的 依存 语法 (Cgrammaire de dependence) ,对 汉语 动 
词 ,形容词 和 部 分 名 词 的 论 元 结构 进行 了 初步 的 探索 ,当时 我 提出 的 
论 元 有 : 施 事 、 受 事 .与 事 . 关 涉 、 时 刻 、. 时 段 . 时 间 起 点 .时 间 终 点 \ 空 
间 点 ` 空 间 段 .空间 起 点 .空间 终点 `. 初 态 . 未 态 、 原 因 、 结 果 、 工 具 方 
式 、 目 的 条件、 作用 内容、 范围 .论题 .修饰 比较、 伴随、 判断、 陈述、 
附加 等 , 共 30 个 ,其 中 , 施 事 、 受 事 . 与 事 3 个 论 元 是 “行动 元 ”Cacta- 
nts) ,其 他 27 个 论 元 是 “状态 元 ”(circonstants)。 我 根据 机 器 词典 中 
存储 的 单词 的 语法 和 语义 的 静态 信息 以 及 在 句法 分 析 中 运算 得 出 的 
句法 功能 的 动态 信息 ,使 用 计算 机 求解 了 这 些 论 元 信息 ,把 汉语 自动 
地 翻译 成 5 种 外 语 , 顺 利 了 完成 了 多 语言 机 器 翻译 实验 。 可 是 ;我 在 
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20 多 年 前 对 于 汉语 论 元 结构 的 研究 ,是 从 依存 语法 和 工程 应 用 的 角 
度 出 发 的 ,根本 没有 考虑 到 这 些 论 元 的 认 知 基础 。 

现在 , 艇 林 从 认 知 的 角度 ,根据 计算 机 处 理 汉 语 的 实际 需要 , 详 
细 地 研究 了 汉语 动词 论 元 结构 的 论 元 属性 、 论 旨 属 性 、 语 法 特征 、 语 
义 特 征 . 配 位 方式 ,把 汉语 动词 的 论 元 分 为 施 事 、 感 事 ` 致 事 \ 主 事 ` 受 
事 .与 事 、 结 果 、 对 象 . 系 事 、 工 具 、 材 料 方式 \ 场 所 、 源 点 ` 终 点 范围 、 
命题 , 共 17 个 。 并 且 使 用 自立 性 、 使 动 性 \ 感 知性 ` 述 谓 性 ,变化 性 
受 动 性 渐 成 性 \ 关 涉 性 类 属性 等 动态 语义 特点 以 及 句法 特点 ,来 区 
分 这 些 论 元 ,从 而 明确 地 界定 了 这 些 论 元 。 统 林 的 研究 ,在 更 深 的 层 
次 上 揭示 了 汉语 论 元 结构 的 特性 和 判断 方法 ,在 逻辑 上 很 有 魅力 ;使 
我 们 得 到 一 种 逻辑 上 的 美感 。 但 是 ,他 提出 的 这 17 个 论 元 中 ,没有 
表示 时 间 、 原 因 、 目 的 .论题 的 论 元 ,而 这 些 论 元 ,在 真实 的 文本 中 是 
经 常 出 现 的 ;而 且 旬 林 提出 的 命题 这 个 论 元 ,实际 上 就 是 句子 ,显然 
是 不 必要 的 。 

也 许 镁 林 察觉 到 了 他 的 这 个 论 元 系统 的 不 足 , 后 来 他 在 语料库 
语义 标注 的 实践 中 ,把 他 的 这 17 个 论 元 进一步 做 了 扩充 。 增 加 了 经 
事 .原因 :目的 .时 间 、 路 径 、 话 题 ` 说 明 等 论 元 ,删除 了 原来 的 命题 论 
元 , 共 23 个 ,形成 了 他 的 “ 论 旨 角色 标记 集 ”“ 这 个 标记 集 基 本 上 履 
盖 了 我 原来 的 30 个 论 元 的 标记 集 ,而且 更 加 精炼 ,每 一 个 论 元 的 区 
别 特征 也 更 加 清楚 了 ,我 红 同 并 且 非 常 欣赏 笠 林 的 这 个 标记 集 。 

和 镑 林 把 他 的 研究 成 果 应 用 于 新 闻 语 体 真实 文本 的 语义 标注 和 信 
息 自 动 抽取 ,效果 良好 ,证 明了 论 元 结构 知识 的 广泛 适用 性 。 他 的 成 
功 说 明了 认 知 语言 学 对 于 计算 语言 学 的 理论 和 实践 确实 是 很 有 吸引 
力 的 。 计 算 语言 学 应 该 吸取 认 知 语言 学 的 成 果 , 从 而 促进 自身 的 发 
展 。 

认 知 科学 的 基础 是 “物理 符号 系统 假设 ”"。 这 种 假设 认为 ,智能 
的 基础 是 符号 操作 ,一 切 认 知 系统 本 质 上 都 是 符号 加 工 系统 ,而 符号 
操作 就 是 计算 , 认 知 就 是 计算 。 

早 在 80 年 代 初 期 ,著名 语言 学 家 本 A. Fodor 在 《表达 )Rez- 
resemta 好 oz 一 书 GCVMIT2Press 太 1980) 中 就 说 过 : “只 要 我 们 认为 心 
理 过 程 是 计算 过 程 ( 因 此 是 由 表达 式 定义 的 形式 操作 ) ,那么 ,除了 将 
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心智 看 作 别 的 之 外 ,还 自然 会 把 它 看 作 一 种 计算 机 。 也 就 是 说 ,我 们 
会 认为 ,假设 的 计算 过 程 包含 哪 些 符号 操作 ,心智 也 就 进行 哪些 符号 
操作 。 因 此 ,我 们 可 以 大 致 上 认为 ,心理 操作 跟 图 灵机 的 操作 十 分 类 
似 。?Fodor 在 这 里 所 说 的 “符号 操作 ”实际 上 也 就 是 “规则 ”, 所 以 ， 
这 种 说 法 代表 了 计算 语言 学 中 的 基于 规则 的 理性 主义 观点 。 这 种 理 
性 主义 的 观点 ,完全 被 后 来 兴起 的 认 知 语言 学 继承 并 进一步 发 展 了 。， 

而 在 认 知 语言 学 产生 之 前 ,在 计算 语言 学 中 的 这 种 基于 符号 操 
作 规 则 的 理性 主义 的 观点 早 就 受到 了 学 者 们 的 批评 。1980 年 ,J. 
了 人. Searle 在 他 的 论文 4 心智 大脑 和 程序 》Mimrds，Braizs zzz Pro 
gs7ra7zz71te5) (1980，, 载 《行为 科学 与 脑 科 学 》[Behapioral and Bra 记 
Sciezces]，Vol. 3) 中 ,提出 了 所 谓 “ 中 文 屋 子 ” 的 质疑 。 他 提出 ,假设 
有 一 个 懂得 英文 但 是 不 懂 中 文 的 人 被 关 在 一 个 屋子 中 ,在 他 面前 是 
一 组 用 英文 写 的 指令 ,说 明 英 文 符号 和 中 文 符号 之 间 的 对 应 和 操作 
关系 的 种 种 规则 。 这 个 人 要 回答 用 中 文书 写 的 几 个 问题 ,为 此 ,他 首 
先 要 根据 指令 规则 来 操作 问题 中 出 现 的 中 文 符号 ,理解 问题 的 含义 ， 
然后 再 使 用 指令 规则 把 他 的 答案 用 中 文 一 个 一 个 地 写 出 来 .这 显然 
是 非常 困难 的 而 且 几 乎 是 不 能 实现 的 事情 。Searle 的 批评 是 非常 尖 
锐 的 ,这 样 的 批评 使 计算 语言 学 中 基于 符号 操作 规则 的 理性 主义 的 
观点 受到 了 普遍 的 怀疑 。 

这 种 理性 主义 方法 的 另 一 个 弱点 是 在 实践 方面 的 2 计算 语言 
中 的 理性 主义 者 往往 把 自己 的 目的 局 限于 某 个 十 分 狭 窗 的 专业 领域 
之 中 ,他 们 采用 的 主流 技术 是 基于 规则 的 句法 -语义 分 析 技 术 , 尽 管 
这 些 应 用 系统 在 某 些 受 限 的 “ 子 语言 ”中 也 曾经 获得 一 定 程 度 的 成 
功 , 但 是 ,要 想 进 一 步 扩 大 这 些 系统 的 覆盖 面 , 用 它们 来 处 理 大 规模 
的 真实 文本 ,仍然 有 很 大 的 困难 。 因 为 从 自然 语言 系统 所 需要 装备 
的 语言 知识 来 看 ,其 数量 之 浩大 和 颗粒 度 之 精细 ,都 是 以 往 的 任何 系 
统 所 远 远 不 及 的 。 而 且 , 随 着 系统 拥有 的 知识 在 数量 上 和 程度 上 发 
生 的 巨大 变化 ,系统 在 如 何 获取 、 表 示 和 管理 知识 等 基本 问题 上 ,不 
得 不 另辟蹊径 。 这 样 ,基于 统计 的 经 验 主 义 方 法 就 越 来 越 受 到 计算 
语言 学 研究 者 的 欢迎 。 

艇 林 的 这 本 文集 ,尽管 其 主要 内 容 是 讲 基 于 认 知 的 汉语 计算 语 
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言 学 研究 ,但 是 ,他 也 注意 到 了 计算 语言 学 中 基于 统计 的 经 验 主义 方 
法 ,他 直率 地 指出 了 基于 统计 的 语言 处 理 模型 的 有 用 性 ”和 "局限 
性 ”, 并 且 认为 “语言 信息 处 理 面临 的 对 象 既 然 有 如 此 顽 劣 的 既 抗 拒 
规则 模型 、 又 抗拒 统计 模型 的 属性 ,那么 一 种 可 能 的 技术 途径 只 能 是 
把 规则 的 方法 和 统计 的 方法 结合 起 来 "。 很 多 认 知 语言 学 家 都 推崇 
认 知 理论 而 排斥 统计 方法 ,而 入 林 独 具 慧 眼 , 他 重视 认 知 而 不 排斥 统 
计 ; 主 张 规则 方法 和 统计 方法 的 结合 ,这 是 难能可贵 的 。 

入 林 在 他 的 文集 中 ;非常 推崇 “计算 语言 学 是 用 计算 机 和 为 计算 
机 研究 语言 的 学 科 ” 这 个 关于 计算 语言 学 的 定义 。 并 且说 ,这 个 定义 
是 国际 计算 语言 学 界 对 计算 语言 学 的 定义 逐步 形成 的 " 共识”。 这 种 
说 法 未 免 有 些 偏 颇 。 

我 认为 ,科学 的 定义 应 该 揭示 计算 语言 学 这 个 学 科 的 本 质 属性 ， 
而 航 林 所 推崇 的 这 个 定义 带 有 明显 的 实用 色彩 ,没有 反映 出 计算 语 
言 学 与 计算 机 科学 在 理论 上 的 联系 ;因而 也 就 难以 反映 这 个 学 科 的 
本 质 属性 。 如 果 一 个 人 在 研究 语言 时 ,仅仅 使 用 计算 机 来 统计 某 些 
语言 单位 的 出 现 次 数 ,显然 还 谈 不 上 他 是 在 研究 计算 语言 学 ,尽管 他 
用 计算 机 研究 了 语言 ;同样 地 ,如 果 一 个 人 仅仅 为 了 在 计算 机 上 输入 
汉字 而 研究 汉字 编码 ,显然 也 谈 不 上 他 是 在 研究 计算 语言 学 ,尽管 他 
是 在 为 计算 机 研究 语言 。 计算 语言 学 是 一 个 独立 的 学 科 , 它 不 仅 有 
着 严格 而 系统 的 理论 ,而 且 还 有 着 完善 而 成 熟 的 方法 ,计算 语言 学 的 
这 些 理论 和 方法 ,正如 物理 学 、 数 学 和 化 学 的 理论 和 方法 一 样 , 绝 不 
是 不 学 而 能 的 ,而 是 要 经 过 刻苦 的 学 习 和 反复 的 实践 才能 掌握 的 。 
如 果 二 个 语言 学 家 只 是 使 用 计算 机 来 研究 语言 而 不 懂 计算 语言 学 的 
基本 理论 和 方法 ,他 只 是 一 个 使 用 计算 机 的 语言 学 家 ,还 谈 不 上 是 一 
个 计算 语言 学 家 ;如 果 一 个 计算 机 专家 为 了 在 计算 机 上 输入 汉字 来 
研究 汉字 编码 而 不 懂得 计算 语言 学 的 基本 理论 和 方法 ,他 也 只 是 一 
个 为 计算 机 而 研究 语言 的 计算 机 专家 ,还 谈 不 上 是 一 个 计算 语言 学 
家 。 

笠 林 说 他 推 尝 的 这 个 定义 已 经 逐渐 成 为 国际 计算 语言 学 界 的 

“共识 ”, 可 能 与 事实 不 符 。 我 查阅 了 很 多 英文 文献 ,并 没有 发 现 这 个 
定义 ,我 还 查阅 了 法 文 ` 德 文 . 俄 文 .日 文 的 文献 ,也 没有 发 现 这 个 定 
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义 。 可 见 , 这 个 定义 远 远 还 没有 成 为 国际 计算 语言 学 的 普遍 共识 。 

如 果 我 们 把 1954 年 第 一 次 机 器 翻译 实验 的 成 功 算 做 计算 语言 
学 的 开始 ,那么 ,计算 语言 学 这 个 学 科 已 经 有 50 多 年 的 历史 了 ,在 计 
算 语 言 学 创始 前 后 那个 充满 了 理性 的 年 代 , 计 算 机 科学 的 先行 者 
Turing 和 Shannon 就 非常 重视 计算 机 科学 的 理论 和 自然 语言 的 联 
系 。Turing 提出 了 著名 的 Turing 实验 ,认为 检验 计算 机 智能 高 低 
的 最 好 办 法 是 让 计算 机 来 讲 英语 和 理解 英语 。Shannon 在 他 的 ( 通 
信 的 数学 理论 》(CMzztjematicat 了 heory o 太 Corrzzzaz7zzcatiioz2) 中 ,用 马 
尔 可 夫 过 程 的 理论 来 分 析 英 语 ,建立 了 信息 论 的 基础 。 他 们 独 树 二 
帜 的 研究 都 与 自然 语言 有 着 千 丝 万 缕 的 联系 ,他 们 的 远见 卓识 都 为 
计算 语言 学 播 下 了 科学 的 种 子 。50 多 年 来 ,他 们 播 下 的 种 子 早已 破 
土 而 出 ,由 纤细 和 柔弱 的 嫩 芽 长 成 了 枝叶 茂密 的 大 树 ; 成 为 了 一 门 独立 
的 学 科 。 所 以 ,在 给 计算 语言 学 这 个 学 科 下 定义 时 ,我 们 切 不 可 忽视 
它 与 计算 机 科学 在 理论 上 的 深刻 联系 ,只 有 这 样 , 才 有 可 能 揭示 出 这 
个 学 科 的 本 质 属性 。 

《计算 机 进展 》(Adcmpazced zz Cozzzpzvtier) 是 国际 计算 机 科学 的 权 
威 出 版 物 ,这 个 出 版 物 登 载 的 文章 ,都 是 引导 计算 机 科学 学 术 潮 流 的 
高 质量 论文 ?从 中 我 们 可 以 罕见 国际 计算 机 科学 的 发 展 方向 。 

美国 计算 机 科学 家 Bill Manaris 在 1999 年 出 版 的 4 计算 机 进 
展 } 第 47 卷 的 从 人 -机 交互 的 角度 看 自然 语言 处 理 》 一 文中 曾经 给 
“自然 语言 处 理 ? 提 出 了 如 下 的 定义 : 

“自然 语言 处 理 可 以 定义 为 研究 在 人 与 人 交际 中 以 及 在 天 与 计 
算 机 交际 中 的 语言 问题 的 一 门 学 科 。 自 然 语 言 处 理 要 研制 表示 语言 
能 力 和 语言 应 用 的 模型 ,建立 计算 框架 来 实现 这 样 的 语言 模型 ,提出 
相应 的 方法 来 不 断 地 完善 这 样 的 语言 模型 ,根据 这 样 的 语言 模型 设 
计 各 种 实用 系统 ,并 探讨 这 些 实用 系统 的 评测 技术 。.” 这 个 定义 的 英 
文 如 下 :“NLP could be defined as the discipline that studies the 
linguistic aspects of human-human and human-machine communica- 
tion，develops models of linguistic competence and performance， 
employs computational frameworks to implement Process incorpo- 


rating such models，identifies methodologies for iterative iefine- 
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ment of such processes/models， and investigates techniques for e- 
valuating the result systems.” (Bill Manaris: 〈《Natural language 
processing: A human-computer interaction perspective》，Adma7zces 
记 Com zaters，Volume 47，1999) 

Bill Manaris 关于 自然 语言 处 理 的 这 个 定义 ,比较 全 面 地 表达 了 
计算 机 对 自然 语言 的 研究 和 处 理 的 主要 内 容 ,说 明了 自然 语言 处 理 
不 仅 要 研究 表示 语言 能 力 (linguistic competenace) 的 模型 ,而 且 还 要 
研究 表示 语言 应 用 (linguistic performance) 的 模型 ， 涉及 到 了 自然 语 
言 处 理 在 理论 上 的 本 质问 题 , 因 此 ,这 个 定义 在 (计算 机 进展 ?上 发 表 
以 后 ,逐渐 得 到 国际 自然 语言 处 理 界 的 共识 。 这 个 定义 是 针对 “自然 
语言 处 理 ” 而 提出 的 ,而 “自然 语言 处 理 ” 与 “计算 语言 ”是 如 此 之 接 
近 , 在 这 里 ,我 愿意 推荐 这 个 定义 给 镀 林 ,作为 他 给 计算 语言 学 这 个 
学 科 下 定义 的 参考 。 

计算 语言 学 的 研究 范围 涉及 到 众多 的 部 门 , 如 语音 的 自动 识别 
与 合成 、 机 器 翻译 .自然 语言 理解 、 人 机 对 话 、 信 息 检索 ;文本 分 类 、 自 
动 广 摘 .机 器 词典 . 语 料 加 工 、 算 法 研究 、 语 言 形式 模型 研究 ,等 等 。 
我 们 认为 ;这 些 部 门 可 以 归纳 为 如 下 四 个 大 的 方向 : 

转 语言 工程 方向 : 把 自然 语言 处 理 作为 面向 实践 的 ` 工 程 化 的 

语言 软件 开发 来 研究 。 这 一 方向 的 研究 一 般 称 为 “人 类 语言 
技术 (Human Language Technique， 简称 HLT) 罗 或 者 称 为 
“语言 工程 >(Language Engineering) 。 

国 数据 处 理 方向 : 把 自 然 语言 处 理 作为 开发 语言 研究 相关 程 
序 以 及 语言 数据 处 理 的 学 科 来 研究 。 这 一 方向 的 研究 早期 
的 研究 有 术语 数据 库 的 建设 .各 种 机 器 可 读 的 电子 词典 的 开 
发 ;近年 来 随 着 大 规模 语料库 的 出 现 , 这 个 方向 的 研究 显得 
更 加 重要 。 

国 人 工 智能 和 认 知 科学 方向 : 把 自 然 语言 处 理 作 为 在 计算 机 
上 实现 自然 语言 能 力 的 学 科 来 研究 ,探索 自然 语言 理解 的 智 
能 机 制 和 认 知 机 制 。 这 一 方向 的 研究 与 人 工 智 能 以 及 认 知 
科学 关系 密切 。 

国 语言 学 方向 : 把 自 然 语 言 处 理 作 为 语言 学 的 分 支 来 研究 , 它 
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只 研究 语言 及 语言 处 理 与 计算 相关 的 方面 ,而 不 管 其 在 计算 

机 上 的 具体 实现 。 这 个 研究 方向 的 最 重要 的 研究 领域 是 语 

法 形式 化 理论 和 自然 语言 处 理 的 数学 理论 。 

我 国 的 计算 语言 学 研究 在 语言 工程 方向 和 数据 处 理 方向 已 经 投 
入 了 很 多 的 资金 和 人 力 , 大 多 数 的 计算 语言 学 工作 者 都 在 探索 这 两 
个 方向 的 问题 ,硕果 累累 。 但 是 ,对 于 人 工 智能 和 认 知 科学 方向 以 及 
语言 学 方向 ,投入 就 比较 少 ,研究 的 人 也 不 多 ,显得 比较 薄弱 。 纹 林 
的 这 本 文集 就 是 专门 探讨 这 两 个 方向 的 各 种 理论 和 实践 问题 的 ,而 
且 已 经 取得 了 煌 煌 的 成 绩 , 令 我 感到 兴奋 。 我 希望 有 更 多 的 学 者 能 
够 重视 这 两 个 方向 的 研究 ,弥补 我 国 计 算 语言 学 研究 的 这 些 菏 弱 环 
节 。 
计算 语言 学 是 语言 学 .计算 机 科学 和 数学 的 交叉 学 科 。 每 一 个 

从 事 计算 语言 学 研究 的 人 ,都 面临 着 知识 更 新 的 问题 。 级 林 是 中 文 
系 出 身 的 一 个 文科 学 者 ,为 了 研究 计算 语言 学 ,他 进行 了 知识 更 新 的 
再 学 习 , 从 他 的 文集 中 可 以 看 出 ,他 不 但 对 于 计算 机 科学 和 数学 不 是 
似 懂 非 懂 的 外 行 ,而 且 他 还 熟悉 计算 语言 学 本 身 独 有 的 基本 理论 和 
方法 ,是 计算 语言 学 的 精 研 通达 的 内 行 ,他 使 用 这 些 理论 和 方法 ,把 
计算 机 科学 和 数学 的 知识 与 语言 研究 有 机 地 巧妙 地 融 为 一 体 。 馆 
林 的 研究 ,把 文科 与 理科 结合 起 来 ,把 汉语 与 外 语 结合 起 来 ,把 理论 
和 实践 结合 起 来 ,我 相信 ,今后 钳 林 在 计算 语言 学 的 研究 中 ,一 定 会 
做 出 更 加 出 色 的 成 绩 。 


冯 志 伟 
于 北京 后 扬 棒 胡同 寅 所 
2007 年 11 月 10 日 
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一 、 于 鼻 理 论 和 
诅 言 研究 


计算 语言 学 的 理论 方法 和 研究 取向 


本 文 从 研究 取向 的 角度 ,对 目前 计算 语言 学 的 几 种 理论 方法 以 及 相 
应 的 语言 处 理 技术 进行 比较 研究 。 着 重 讨论 工程 主义 、 工 具 主义 \ 认 知 主 
义 、 实 证 主义 和 珊 辑 主义 五 种 研究 取向 ,比较 几 种 关于 人 类 知识 和 语言 理 
解 过 程 及 相应 的 计算 机 模拟 策略 的 理论 ,分 析 其 在 具体 的 语言 处 理 技术 
(包括 语法 形式 体系 、 语 义 表示 体系 、 分 析 算法 以 至 程序 实现 ) 上 的 差异 。 
希望 对 不 同 的 理论 方法 和 处 理 技术 的 效能 和 局 限 有 一 个 比较 清楚 的 认 
识 ; 从 而 为 汉语 计算 语言 学 的 研究 提供 借 监 。 


0 计算 机 : 语言 研究 的 奴仆 还 是 上 帝 


在 社会 语言 学 ` 文 化 语言 学 ,心理 语言 学 .神经 语言 学 ` 认 知 语言 
学 ` 数 理 语 言 学 和 计算 语言 学 等 当代 带 分 号 的 语言 学 (hyphenated 
linguistics) 中 ,计算 语言 学 是 一 门 跟 当 代 科 学 技术 关系 最 密切 的 学 
科 ，, 同 时 也 是 一 门 定义 最 为 纷 歧 的 学 科 。 只 要 打开 有 关 的 文献 ,你 就 
能 找到 关于 计算 语言 学 的 各 种 差别 极 大 的 定义 。 事 实 上 ,这 些 不 同 
的 定义 背后 反映 了 不 同 的 研究 者 的 不 同 的 研究 取向 。 其 中 ,最 核心 
的 一 点 是 : 怎样 看 待 计算 机 和 语言 研究 的 关系 ,是 把 计算 机 作为 语 
言 研究 的 工具 ` 还 是 作为 语言 研究 的 目标 和 服务 对 象 。 形 象 地 说 ,把 
计算 机 当 作为 语言 研究 服务 的 奴仆 .还 是 当 作 语言 研究 要 为 之 服务 
的 上 帝 。 

下 面 , 我 们 通过 五 种 关于 计算 语言 学 的 定义 ,来 讨论 工程 主 
义工 具 主 义 、. 认 知 主义 .实证 主义 和 逻辑 主义 五 种 不 同 的 研究 取 
向 ,比较 不 同 的 研究 者 为 了 实现 这 些 不 同 的 目标 而 采用 的 过 然 不 
同 的 理论 和 方法 (包括 对 人 类 知识 .语言 习 得 和 语言 理解 过 程 的 看 
法 、 以 及 相应 的 在 计算 机 上 模拟 的 策略 ), 分 析 其 在 具体 的 语言 处 
理 技 术 ( 包 括 语法 形式 体系 .语义 表示 体系 ` 分 析 算 法 以 至 程序 实 
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现 ) 上 的 差异 。 和 希望 对 计算 语言 学 中 不 同 的 理论 方法 和 处 理 技术 
的 效能 和 局 限 有 一 个 比较 清楚 的 认识 ,从 而 为 汉语 计算 语言 学 的 
研究 提供 借鉴 。 


1 工程 主义 取向 : 着 眼 于 计算 机 系统 的 建立 


在 计算 语言 学 的 诸多 定义 中 ,最 多 的 是 着 眼 于 建立 一 种 可 运转 
的 计算 机 系统 。 例 如 : 


(1) Computational linguistics ls the study of computer 
systems for understanding and generating natural language. 
Grishman (1986) ，p. 4 
(计算 语言 学 是 对 能 理解 和 生成 自然 语言 的 计算 机 系统 的 研究 ) 

(2) 计算 语言 学 是 采用 计算 机 技术 来 研究 和 处 理 自然 语言 
的 一 门 新 兴学 科 。 


一 一 冯 志 伟 (1992) ,第 .84 页 


持 这 种 观点 的 学 者 自然 会 把 计算 语言 学 的 研究 重点 放 在 这 种 能 理解 
和 生成 自然 语言 的 计算 机 系统 的 结构 及 相应 的 各 种 算法 的 设计 上 。 
因为 ,从 理论 上 说 ,要 想 让 计算 机 去 解决 某 种 问题 ,必须 满足 下 列 三 
个 基本 的 前 提 条 件 : 

第 一 ,必须 把 待 解 的 问题 形式 化 。 由 于 计算 机 只 能 对 有 限 符号 
集 上 的 有 限 长 度 的 符号 序列 进行 决定 型 的 形式 变换 (这 就 是 计算 )， 
因而 首先 要 建立 一 个 形式 系统 (formalism, 一 译 形式 体系 ): 规定 所 
用 的 各 种 符号 (词汇 ) ,规定 把 符号 连接 成 合法 序列 ( 即 合式 公式 ) 的 
规则 (句法 ) ,规定 合法 的 符号 串 如 何 表 示 特 定 问 题 领域 中 的 意义 ( 语 
义 , 或 解释 ) ;然后 ,建立 一 些 推理 规则 ,说 明 对 这 些 符 号 和 合法 符号 
串 可 以 进行 一 些 什 么 样 的 处 理 ( 演 算 )。 于 是 ,问题 便 可 以 用 符号 表 
达 出 来 ,问题 的 解 也 表现 为 对 符号 序列 的 条 件 。 这 样 , 计 算 机 解决 问 
题 的 过 程 就 是 从 表示 问题 的 符号 序列 出 发 , 按 规则 进行 加 工 , 一 直到 


四， 详 兄 马 希 文 (1986) ,第 :225 一 228 页 。 
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得 出 符合 要 求 的 符号 序列 ( 即 解 ) 为 止 。 这 一 整套 的 办 法 叫 形 式 化 
《又 叫 数学 方法 ) ,其 要 义 是 : 把 特定 领域 的 问题 转变 为 符号 ,从 而 把 
对 问题 的 求解 转变 为 对 符号 串 的 变换 处 理 。 

第 二 ,这 种 问题 必须 是 可 计算 的 (computable) ， 即 一 定 要 有 解 题 
的 算法 (algorithm) ,使 得 计算 机 能 按照 算法 所 指引 的 解 题 步 又, 通 
过 有 限 步 的 运算 而 得 出 结果 。 

第 三 ,这 种 问题 必须 有 一 个 合理 的 复杂 度 ,也 就 是 要 避免 指数 爆 
炸 (exponential explosion) 。 也 就 是 说 ， 问题 的 复杂 性 必须 限制 在 目 
前 的 数字 计算 机 的 存储 空间 和 运算 时 间 所 能 容忍 的 范围 之 内 。 

所 以 ,从 研究 程序 上 讲 , 这 种 类 型 的 计算 语言 学 研究 一 般 分 为 如 
下 三 个 阶段 : 


第 一 步 , 数 学 建 模 。 把 需要 研究 的 问题 在 语言 学 上 加 以 形 
式 化 (linguistic formalism) ,使 之 能 以 一 定 的 数学 形 式 \ 严 密 而 
规整 地 表示 出 来 。 也 就 是 说 ,为 有 关 的 语言 问题 建立 数学 模型 ， 
包括 选择 恰当 的 形式 语法 (formal grammar) 使 得 句子 的 结构 能 
够 用 某 种 数学 形式 明确 而 清晰 地 表示 出 来 ,研究 在 这 种 形式 语 
法 之 下 如 何 分 析 和 句子 构造 的 方法 和 步骤 ;选择 恰当 的 表示 体系 
使 得 句子 的 意义 能 够 用 某 种 数学 形式 明确 而 清晰 地 表示 出 来 ， 
研究 在 这 种 形式 体系 之 下 如 何 分 析 和 表示 句子 的 语义 结构 。 

第 二 步 ,， 算 法 设计 。 把 这 种 严密 而 规整 的 数学 形式 表示 为 
算法 (algorithm) ,使 之 在 计算 上 形式 化 Ccomputational formal- 
ism)。 这 就 必须 研究 句子 分 析 的 严格 的 手续 Cprocedures) ,并 
抽象 成 机 械 的 、 明 确 的 、 一 步 步 逼 近 分 析 结 果 的 步骤 。 

第 三 步 ,程序 实现 。 根 据 算法 用 某 种 程序 语言 编写 计算 机 
程序 ,使 之 在 计算 机 上 加 以 实现 Ccomputer implementation ) 。 


比如 ,假定 有 下 面 这 部 小 型 的 用 产生 式 (production) 表 示 的 语 境 自 
由 的 短语 结构 语法 : 


@ “参考 冯 志 伟 (1992) ,第 84 页 ; 钱 锋 (1990) ,第 26 一 27 页 ; 
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SNPHENVNBP 写 和 生生 R1 
由 人 雪 了 鸯 TO R2 
NP->PRO R3 
汪汪 R4 
有 R5 
那么 ,句子 I like cheese. (我 喜欢 奶 酷 ) 的 最 左 推导 是 : 
S 一 NP 十 VP 
一 PRO 十 VP 
一 PRO 十 Vt 十 NP 
一 PRO 十 Vt 十 N 


为 了 让 计算 机 能 根据 上 面 给 出 的 语法 规则 自 动 地 分 析 这 个 句子 , 必 
须 设计 相应 的 算法 ， 或 者 是 自 顶 向 下 的 回溯 算法 ,或 者 是 自 底 向 上 
的 并 行 算 法 。 自 顶 向 下 的 回溯 算法 每 次 只 尝试 一 种 推导 * 当 一 种 推 
导 失 败 时 便 返回 .重新 尝试 另 一 种 推导 ;就 这 样 逐 个 地 枚 举 语法 所 多 
许 的 各 种 推导 ,直至 找到 一 个 能 生成 输入 句子 的 推导 。 根据 这 种 算 
法 (具体 的 细节 从 略 ), 对 于 上 文 那 部 只 有 五 条 规则 的 语法 ,句子 I 
like cheese. 的 推导 过 程 将 表现 如 下 ; 

二 ) 汪 

ii。S->NP 十 VP 

ii，S->NP 十 VP- 一 N 十 VP 

iv S>NP 十 VP-~>PRO 十 VP 

v.， S_ >NP 十 VP 一 PRO 十 VP->PRO 十 Vi 

Vi S>NP 十 VP 一 PRO 十 VP->PRO 十 Vt 十 NP 

Vii。 SNP 十 VP->PRO 十 VP->PRO 二 VtTN 


is 是 初始 符 , 即 树 顶 节点 ;让 根据 R1, 展 开 初 始 符 ;iii. 根据 R2 展开 
最 左 的 非 终 结 符 , 但 是 范畴 N 跟 词 项 I 不 匹配 ,需要 回溯 ;iv. 根据 
R3 展开 最 左 的 非 终结 符 , 范 畴 PRO 跟 词 项 I 匹 配 成 功 ;iv. 根据 R4 
展开 左 端 第 二 个 非 终 结 符 , 但 是 范畴 Vi 跟 词 项 like 不 匹配 ,需要 回 
溯 ;vi. 根据 R5 展开 左 端 第 三 个 非 终结 符 , 范 畴 'Vt 跟 词 项 like 匹配 
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成 功 ;vii. 根据 了 2 展开 最 后 一 个 非 终结 符 , 范 畴 N 跟 词 项 cheese 匹 
配 成 功 ;至 此 ,推导 结束 . 

一 般 地 说 ,计算 语言 学 的 研究 既 必 须 涉及 计算 机 科学 中 的 复杂 
性 理论 Ccomplexity theory, 用 以 判别 所 研究 的 问题 是 否 具有 可 计算 
性 ) 编译 技术 (compiler technology)、 搜 索 策 略 (search strategies) 、 
真 值 保 持 系 统 (truth-maintenance systems)、 自 动 定理 证 明 (auto- 
matic theorem proving)、 知识 表示 (knowledge representation) 和 数 
据 结构 (data structure) 等 方面 ,同时 也 必须 涉及 语言 学 中 的 语音 学 
(phonetics)、 音 系 学 (phonology) 形态 学 (morphology, 或 词法 学 )、 
句法 学 Csyntax) 语义 学 (semantics)、 语 用 学 (pragmatics) 话 语 分 
析 (discourse analysis) 等 方面 。 可 以 图 示 于 下 :@ 


复杂 性 理论 语音 学 
音 系 学 
形态 学 
句法 学 


自动 定理 证 明 语义 学 
知识 表示 语 用 学 
数据 结构 话语 分 析 


如 果 说 科学 是 理论 和 知识 体系 .技术 是 方法 和 操作 技巧 .工程 是 
实践 和 具体 施行 的 话 ,那么 计算 语言 学 就 是 一 种 工程 。 为 了 建造 一 
个 顺畅 (fluent)、 健 壮 (robust) 的 自然 语言 处 理 系统 ,必须 整合 许多 
不 同类 型 的 知识 ;诸如 句法 知识 .语义 知识 .话语 领域 知识 等 ,并 且 要 
有 效 地 用 到 自然 语言 处 理 系统 中 。 正 是 在 这 一 意义 上 ,建造 处 理 自 
然 语言 的 计算 机 系统 跟 建 造 其 他 大 型 的 计算 机 系统 一 样 ,主要 是 一 
种 工程 性 的 工作 。 跟 其 他 系统 建造 工作 一 样 ,计算 语言 学 采用 模块 


@ 详 见 石 纯 一 等 (1993) ,第 355 一 363 页 。 
加 “参考 Halvorsen (1988) ,pp. 202 一 203. 
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化 (modularity) 和 建立 形式 模型 (formal models) 两 种 通用 技术 。 所 
谓 模块 化 指 把 我 们 的 系统 所 涉及 的 知识 分 割 为 相对 独立 的 成 分 , 然 
后 分 别 攻克 一 个 个 子 问 题 , 从 而 缩小 整个 系统 的 规模 。 所 谓 建 立 形 
式 模型 指 为 复杂 系统 建立 一 种 相对 简单 的 抽象 模型 ,然后 为 这 种 简 
化 的 模型 设计 我 们 的 计算 机 系统 .9 

这 种 工程 主义 取向 的 计算 语言 学 研究 是 有 很 强 的 应 用 动机 的 。 
因为 语言 是 人 类 交际 和 记录 信息 的 工具 (vehicle), 如 果 使 计算 机 获 
得 生成 和 理解 自然 语言 的 能 力 , 那 么 计算 机 就 能 执行 只 有 人 类 才能 
完成 的 工作 ,诸如 翻译 .文本 处 理 、 信 息 抽取 和 检索 等 ;所 以 ,能 处 理 
自然 语言 的 计算 机 系统 将 使 计算 机 更 为 有 用 。.@ 也 就 是 说 ,通过 计 
算 语 言 学 的 研究 ,可 以 开拓 更 多 的 计算 机 应 用 领域 。 


2 工具 主义 取向 : 着 眼 于 用 计算 机 
作 语 言 分 析 


计算 语言 学 最 宽泛 的 定义 是 : 用 计算 机 来 研究 和 处 理 自 然 语 
。 例 如 : 
(1) 计算 语言 学 是 关于 自然 语言 的 计算 机 处 理 的 一 门 学 
科 。 它 用 计算 机 技术 来 研究 和 处 理 自然 语言 。 
一 一 陆 致 极 (1990) ,第 15 页 
(2) 计算 语言 学 是 利用 电子 数字 计算 机 进行 的 语言 分 析 。 
es 计算 分 析 最 常用 于 处 理 基本 的 语言 数据 一 -例如 建立 语 
音 、 词 、 词 元 素 的 搭配 以 及 统计 它们 的 频率 。 
一 一 (大 不 列 颠 百科 全 书 》, 转 引 自 翁 富 良 等 (1998) ,第 1 页 
(3) 对 计算 语言 学 一 般 有 狭义 的 和 广义 的 两 种 理解 。 狭 义 
理解 盛行 于 计算 语言 学 最 为 发 达 的 美国 , 它 大 致 上 就 是 人 工 智 
能 中 自然 语言 理解 (包括 机 器 翻译 ) 的 理论 和 方法 部 门 , 它 的 操 


贡 


四 详 见 Grishman (1986),pp. 7 一 8. 
回 ” 详 见 Grishman (1986),p. 1. 
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作 内 容 大 致 上 就 是 上 面 所 提 到 的 (1) 一 (5)。9 广义 的 理解 则 把 

凡是 利用 计算 机 处 理 自然 语言 的 有 关 问 题 ( 例 如 ,风格 研究 ) 都 

填 括 进来 了 ,这 种 理解 欧洲 比较 盛行 。 

一 一 钱 锋 (1990) ,第 27 一 28 页 

在 这 种 包容 性 很 大 的 定义 中 ,除了 有 1 中 讨论 的 研究 能 理解 自然 
语言 的 计算 机 系统 之 外 ,还 有 利用 计算 机 来 进行 跟 语 言 相 关 的 研究 
等 内 容 ; 比 如 ,用 计算 机 对 字母 频率 .汉字 频率 . 词 长 . 句 长 ` 句 型 等 语 
言 成 分 的 统计 研究 ,以 及 建立 在 语言 成 分 的 统计 基础 上 的 作品 风格 
研究 和 匿名 作品 的 作者 考证 研究 等 。 简 单 地 说 ,工具 主义 取向 的 计 
算 语 言 学 着 眼 于 用 计算 机 来 进行 语言 的 计量 研究 (quantitative 
studies) 。 

值得 一 提 的 是 , 随 着 用 计算 机 来 采集 .整理 ` 加 工 和 管理 语言 材 
料 工 作 的 深入 开展 ,逐步 形成 了 语料库 语言 学 (corpus linguistics) 这 
门 计 算 语 言 学 的 分 支 学 科 。 大 概 地 说 ,语料库 语言 学 研究 机 器 可 读 
的 (machine-readable) 自然 语言 文本 的 采集 、 存 储 、 检 索 、 统 计 、 语 法 
标注 Cgrammatical tagging)、 句 法 语义 分 析 , 以 及 具有 上 述 功能 的 语 
料 库 在 语言 定量 分 析 、 作 品 风格 和 作者 考证 研究 .词典 编 篆 .自然 语 
言 理 解 和 机 器 翻译 等 领域 中 的 运用 。 比 如 ,为 了 研究 现代 美国 英语 ， 
美国 的 布朗 大 学 在 1964 年 建立 了 库容 量 为 100 万 词 的 Brown 语 料 
库 。 为 了 研究 现代 英国 英语 ,英国 的 兰 开 斯 特大 学 跟 挪 威 的 奥斯陆 
大 学 . 卑 尔 根 大 学 在 20 世纪 70 年 代 合 作 建 成 LOB 语料库 ,库容 量 
也 是 100 万 词 。 欧 美 各 国 的 学 者 利用 这 两 个 语料库 开展 了 大 规模 的 
英语 研究 。 在 1970 一 1978 年 间 , 他 们 用 86 种 词类 标记 对 布朗 语 料 
库 进 行 语 法 标注 。Greene 和 Rubin 还 设计 了 名 叫 TAGGIT 的 自动 
标注 系统 ,其 庞大 的 规则 库 里 有 3300 条 上 下 文 有 关 规 则 。TAGGIT 
系统 对 布朗 语料库 的 全 部 100 万 词语 料 进 行 自 动 标注 的 正确 率 达 
77% ,其 余 的 同形 和 兼 类 歧义 问题 最 后 由 人 工 来 解决 .9 人 

从 方法 论 上 看 ,语料库 语言 学 跟 工 程 主义 的 计算 语言 学 很 不 相 


@ 这 里 的 (1) 一 (5) 就 是 8$ 1 中 第 一 ~ 三 步 的 内 容 。 
四 “参考 黄 昌 宁 (1990) ,第 ,43 一 44 页 ; 冯 志 伟 (1992) ,第 90 页。 
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同 。 后 者 采用 的 是 以 知识 (表示 成 规则 ) 为 基础 的 方法 , 即 人 工 智能 
的 方法 。 这 种 方法 假定 : 如 果 计 算 机 要 处 理 自然 语言 ,那么 它 必 须 
跟 人 一 样 具有 句法 .语义 、 语 用 话语 篇 章 ,: 主 题 事物 ` 周 围 世界 等 方 
面 的 知识 和 逻辑 推理 能 力 。 因 为 人 处 理 语言 时 的 心理 状态 和 心理 过 
程 就 是 这 样 的 ,计算 机 必须 具有 跟 人 相同 和 相近 的 知识 才能 处 理 自 
然 语言 。 而 语料库 语言 学 采用 的 则 是 以 语 料 统 计 为 基础 的 方法 , 即 
基于 概率 的 方法 。 这 种 方法 认为 : 计算 机 并 不 能 像 人 一 样 利用 知识 
去 理解 语言 ,人 们 也 无 法 把 理解 语言 所 需 的 各 种 知识 形式 化 地 表示 
成 规则 。 有 鉴于 此 ,这 种 方法 假定 : 如 果 我 们 能 对 数量 很 大 的 语言 
数据 作出 定量 化 的 统计 分 析 , 那 么 我 们 就 能 对 语言 成 分 的 分 布 和 语 
言 成 分 之 间 的 关系 等 进行 概率 性 的 预测 ,从 而 补偿 计算 机 缺乏 知识 
和 推理 能 力 的 缺点 .0 比如 ,在 1978 一 1983 年 间 , 英 国 的 .Leech、 
Sampson .Garside 等 人 对 LOB 语料库 进行 词类 标注 实验 。 为 此 ,他 
们 还 设计 了 一 个 名 叫 CLAWS 的 系统 (Constituent-Likelihood 
Automatic Word-tagging System) 。 他 们 完全 放弃 了 传统 的 规则 模 
型 ,把 自动 标注 的 算法 建立 在 统计 信息 的 基础 上 。 他 们 采用 了 133 
种 词类 标记 ,利用 已 带 有 语法 标记 的 Brown 语料库 来 获取 两 个 相 邻 
标记 的 同 现 频率 , 据 此 建立 了 一 个 规模 为 133X133 的 “标记 转移 概 
率 和 矩阵 >(tagging transition probability matrix), 用 以 反映 在 前 一 种 
标记 的 条 件 下 后 一 种 标记 出 现 的 概率 。 整 个 语法 标注 过 程 所 依据 的 
知识 都 是 由 这 个 矩阵 提供 的 。CLAWS 系统 对 LOB 语料库 的 全 部 
100 万 词语 料 进行 自动 标注 的 正确 率 达 96% , 比 基 于 规则 的 TAG- 
GIT 系统 提高 了 将 近 20%。.@ 例如 , 对 于 句子 “Hernry' likes 
stews.2, 其 中 Henry 是 名 词 短 语 , 只 有 NP 一 种 标记 ;likes 和 stews 
可 以 是 名 词 复数 和 动词 第 三 人 称 单数 ,因而 有 NNS 和 VBZ 两 种 标 
记 。 于 是 ,这 三 个 词 可 以 有 下 列 四 种 词类 搭配 方式 : 


iNP 十 NNS 十 NNS 十 .一 17X5XI35 一 11475 
ij NE 十 NNSTVBBZHH 涯 17 关 开关 37 二 :629 


@ 参考 桂 诗 春 、 宁 春 岩 (1997), 第 138 一 149 页 。 
@ ”参考 黄 昌 宁 (1990) ,第 44 页 ; 桂 诗 春 、 宁 春 岩 (1997) ,第 145 页 。 
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ii NP 十 VBZ 十 NNS 十 .=7X28X135 一 26460 
iv NP 十 VBZ 十 VBZ 十 . 王 7X0X37 王 0 


在 这 些 由 形式 类 表示 的 搭配 方式 的 右 侧 (等 号 后 面 ) 给 出 每 种 标记 跟 
相 邻 标记 的 同 现 概 率 , 并 用 这 种 概率 的 乘积 作为 决定 某 种 搭配 方式 
的 概率 的 变量 。 假 定 决定 某 种 搭配 方式 的 概率 等 于 该 变量 除 以 所 有 
变量 的 和 ,那么 第 三 种 搭配 的 概率 最 高 (26460/11475 十 629 十 26460 十 
0 王 69%)。 系 统 可 以 据 此 确定 句子 “Henry likes stews。 ”的 形式 类 
标记 是 NE 十 VBZ 十 NNS。 既然 通过 概率 计算 可 以 确定 兼 类 词 在 
某 种 组 合 中 的 词类 属性 ,那么 由 兼 类 词 引 起 的 结构 歧义 也 可 以 通过 
概率 计算 来 消 靶 (Cdisambiguation 或 ambiguity resolution)， 于 是 ， 
基于 语料库 的 统计 模型 不 仅 可 以 用 来 解决 自然 语言 的 语法 标注 任 
务 ,而 且 还 可 以 运用 到 句法 .语义 等 更 高 层次 的 分 析 上 来 .@ 


3 认 知 主义 取向 : 着 眼 于 人 类 使 用 
语言 时 的 心理 过 程 


在 计算 语言 学 的 定义 中 ,为 数 不 多 的 涉及 人 类 使 用 语言 时 的 心 
理 过 程 。 例 如 : 

《1) 计算 语言 学 是 一 门 计 算 机 科学 和 语言 学 紧密 结合 的 科 
学 。 它 用 数学 的 方法 来 制订 语言 规则 和 模型 去 解决 有 关 计 算 机 
的 语言 学 习 和 理解 .语言 信息 的 存储 、 组 织 、 更 新 、 转 挽 和 生成 等 

问题 。 在 这 些 问题 中 ,核心 是 学 习 和 理解 。 
一 一 黄 建 烁 (1991), 第 24 页 
(2) Computational linguistics is best viewed as branch of 
attificial intelligence(AI). As all fields within AI，it is con- 
cerned with the _ investigation and modeling of a cognitive 


capacity。JIn the case of computational linguistics it is the lan- 


@ 参考 桂 诗 春 、. 宁 春 岩 (1997) ,第 138 一 149 页 。 
四 “参考 黄 昌 宁 (1990) ,第 44 页 。 
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guage capacity that it is in focus， However， the concern ls not 
necessarily to construct a _ psychologically reajlistic model of 
human behavior. The goal is rather to identify and characterize 
the classes of processes and the types of knowledge which are 
implied by the ability to communicate and assimilate informa- 
tion using natural language regardjess of their psychological 


Status。 


Halvorsen (1988) ,p. 202 

(计算 语言 学 最 好 看 作 是 人 工 物 能 的 一 个 分 支 。 跟 人 工 智 
能 的 所 有 其 他 领域 一 样 , 它 涉及 对 认 知 能 力 的 研究 和 建 模 。 在 
计算 语言 学 这 里 , 它 着 重 的 是 语言 能 力 。 但 是 ,这 种 研究 不 必 去 
建构 关于 人 类 行为 的 具有 心理 真实 性 的 模型 。 其 目的 就 在 于 确 
定 和 刻画 用 自然 语言 进行 交际 和 获取 信息 的 能 力 中 所 包含 的 知 
识 的 种 类 及 相关 处 理 过 程 的 类 别 ,而 不 管 其 实际 的 心理 状态 。) 


黄 建 烁 (1991) 的 定义 为 计算 语言 学 确立 了 一 种 非常 宏伟 的 目标 , 那 
就 是 教会 机 器 自动 地 学 习 , 即 让 机 器 理解 语言 并 自动 地 学 习 和 更 新 
知识 。 用 Hans Karlgreen 教授 的 话 来 说 ,就 是 “用 计算 的 方法 来 制 
定 人 类 语言 行为 的 模型 ,并 以 此 去 了 解 人 们 怎样 听 说 读 写 ,怎样 学 习 
新 知识 和 更 新 旧 知 识 ,又 是 怎样 理解 、. 存 储 和 组 织 语言 信息 的 "。 他 
甚至 认为 ,计算 语言 学 的 一 个 最 根本 的 问题 就 是 了 解 “ 人 类 的 大 部 分 
活动 在 什么 程度 上 能 够 简化 成 机 械 的 操作 ”sm Halvorsen (1988 ) 
则 强调 ,计算 语言 学 是 对 人 类 语言 处 理 能 力 和 心理 过 程 的 功能 (而 不 
是 结构 ) 模 拟 。 这 就 是 典型 的 人 工 智能 方法 。 这 种 功能 模拟 的 方法 
直接 影响 和 促成 了 认 知 心理 学 的 基本 信念 : 可 以 把 计算 机 作为 人 类 
思维 的 模型 ,也 可 以 用 计算 机 来 模拟 人 类 的 认 知 过 程 。 
T，Winograd (1983) Lazgxuageas 4 Cog771De Process([ 把 ] 语 
言 作为 一 种 认 知 过 程 5 看 待 ]) , 则 可 以 说 是 认 知 主义 取向 的 杰出 典 
范 。 他 由 下 列 两 个 问题 激发 灵感 ,尝试 建立 一 种 语言 研究 的 认 知 范 


@ 详 见 黄 建 烁 (1991) ,第 31 页。 
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式 (Ccognitive paradigmy) : 


i， 一 个 人 要 说 话 和 理解 语言 ,必须 具有 哪些 知识 ? 
ii 为 了 在 交际 中 使 用 这 些 知识 ,人 的 心智 是 怎样 组 织 的 ? 


他 把 语言 使 用 看 作 是 一 种 以 知识 为 基础 的 交际 过 程 ,认为 人 无 论 是 
说 话 还 是 听话 都 必须 具有 一 定 的 知识 ;比如 , 词 序 规则 、` 词 汇 和 词 的 
结构 .语义 特征 、 所 指 关 系 、 时 制 系统 .话语 结构 .说话 人 的 态度 .韵律 
规约 风格 规约 .世界 知识 等 。 在 理论 方面 ,他 企图 探讨 人 是 怎样 习 
得 .运用 这 些 知 识 的 ;在 实际 运用 方面 ,他 尝试 用 计算 机 来 模拟 人 习 
得 储存. 运 用 这 些 知识 的 过 程 , 所 以 他 又 称 这 种 范式 为 计算 的 范式 
(Ccomputational paradigm) 。Q 

这 种 取向 的 学 者 喜欢 用 认 知 心理 学 的 眼光 来 看 待 语言 使 用 。 从 
信息 加 工 过 程 的 观点 看 ,人 说 出 一 句 话 和 理解 一 句 话 时 ,在 大 脑 中 有 
一 个 关于 所 描述 的 外 部 世界 中 的 事物 或 事件 的 心理 映 象 , 可 以 称 之 
为 内 部 语言 ;而 人 处 理 语 言 的 过 程 就 是 把 外 部 语言 转化 为 内 部 语言 ， 
经 过 加 工 后 再 由 内 部 语言 转化 为 外 部 语言 的 过 程 。 计 算 机 也 可 以 用 
类 似 的 过 程 来 处 理 自然 语言 : 首先 确定 一 种 语言 的 内 部 表示 ;然后 ， 
寻求 一 种 把 所 限定 的 语言 子 集中 的 语句 转换 为 内 部 表示 的 方法 。 在 
他 们 看 来 ,让 计算 机 理解 语言 的 关键 是 : 应 能 对 一 般 的 自然 语言 的 
句子 作 出 语义 解释 , 即 设计 一 种 一 般 的 内 部 表示 。 内 部 表示 是 自然 
语言 处 理 的 关键 , 它 影 响 着 系统 对 语言 知识 和 世界 知识 的 描述 和 利 
用 ,因此 也 影响 着 整个 处 理 系统 .@ 

不 同 的 学 者 由 于 对 人 类 处 理 语言 的 心理 过 程 的 认识 不 同 ,因而 
采用 了 不 同 的 理论 和 方法 来 建造 自然 语言 处 理 系 统 。 其 中 ,二 类 系 
统 比较 重视 句法 分 析 , 尽管 所 依据 的 语法 理论 各 不 相同 。 比 如 ， 
Winograd 于 1972 年 研制 了 关于 积木 世界 的 SHRDLU 系统 ;该 系 
统 可 以 接受 命令 ,通过 一 只 机 械 手 对 积木 进 行 操作 ,回答 有 关 积 未 世 
界 所 处 的 状态 的 问题 。 他 认为 句法 需要 解决 的 问题 是 : 语言 究竟 是 


@ 详 见 Winograd (1983) ,pp. 1 一 34. 另外 ,参考 黄奕 (1985) 对 该 书 的 介绍 和 评论 。 
四 ， 详 见 杨 抒 (1988) ,第 21 一 23 页 。 
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怎样 组 织 起 来 表达 语义 的 ? 他 采用 Halliday(1967、.1970) 的 系统 语 
法 (Systemic Grammar) ,把 句法 结构 看 作 是 生成 句子 的 过 程 中 一 系 
列 句法 结构 选择 的 结果 。 比 如 ,小 名 (clause) 是 由 主 句 性 (major) 和 
从 名 性 (secondary) 两 个 特征 构成 的 一 个 系统 ,它们 是 互相 排斥 的 名 
法 特征 ,任何 小 句 只 能 选择 其 中 的 一 个 特征 ;陈述 Cdeclarative)、 祈 
使 Cimperative)、 帮 问 Cquestion) 三 种 句法 特征 构成 一 个 系统 , 主 句 
(major clause) 必 须 选 择 其 中 的 一 种 句法 特征 。 语义 根据 一 定 的 外 
部 世界 模型 作出 推论 来 指示 句法 分 析 , 从 而 得 出 句子 的 正确 的 语义 
解释 。 例 如 ,在 “I rode down the street in a car. ”中 ,只 有 运用 世界 
知识 (街道 不 可 能 在 汽车 里 ) 作 出 推论 ,才能 排除 in a car 作 street 的 
修饰 语 。SHRDLU 系统 的 工作 过 程 是 : 运用 扩充 转移 网 络 (aug- 
mented transition network，ATN) 的 句法 知识 和 跟 积 木 世 界 相关 的 
语义 知识 对 输入 名 进行 句法 语义 分 析 , 然后 直接 运用 过 程 表示 的 
Cprocedural) 知识 对 输入 句 进行 推理 ,最 终 找 到 所 需 执 行 的 过 程 知 识 
并 执行 之 。Woods 于 1972 年 设计 了 关于 月 球 化 学 成 分 的 LUNAR 
系统 ,该 系统 的 句法 部 分 根据 Chomsky(1965) 的 转换 生成 语法 ,分 
析出 标准 理论 所 指定 的 深层 结构 ,再 输入 语义 部 分 。 语 义 部 分 根据 
句法 上 的 深层 结构 再 进行 语义 信息 的 分 析 。 数 据 检 索 部 分 再 根据 输 
入 句 的 语义 编译 成 一 种 面向 系统 的 形式 语言 ( 即 查 询 语 句 )， 以便 直 
接 查 询 数据 库 , 并 最 终 产生 结果 ( 即 回答 )。Simmon 〈1973) 根 据 
Fillmore (1968) 的 格 语法 (Case Grammar) 建 立 了 语义 网 络 理论 。 
他 采用 Woods 的 ATN 来 分 解 输 入 名 的 句法 关系 ,同时 分 析 深 层 格 
结构 ,记录 语义 关系 ;最 后 求 出 输入 句 的 语义 关系 , 据 此 来 理解 语义 。 
另 一 类 系统 不 作 详细 的 句法 分 析 , 直 接 从 语句 中 抽取 语义 信息 。 比 
如 ,Yorick A.、Wilks 认为 , 整 段 言 谈 的 内 容 是 由 一 些 简 单 的 基本 信 
息 构 成 的 。 一 个 复杂 的 句子 也 是 由 基本 信息 通过 概念 连结 成 实时 的 
线性 序列 ,而 不 是 语言 学 家 所 认为 的 具有 层次 的 树 形 结构 。 在 这 种 
思想 指导 下 ,Wilks (1973) 用 人 工 智 能 的 方法 设计 了 一 个 英法 机 器 
翻译 的 模型 。 英 语词 汇 量 600, 用 以 组 成 英语 日 常用 语 ; 把 简单 的 段 
落 输入 计算 机 ,能 译 成 通顺 的 法 语 输出 。 这 个 模型 不 作 名 法 分 析 ,而 
是 用 一 套 “ 语 义 模板 ”来 接受 输入 句 中 的 信息 。 也 就 是 说 ,该 系统 把 
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源 语 言 的 输入 语句 直接 处 理 为 一 种 语义 结构 ,作为 一 种 中 介 成 分 ,再 
据 此 生成 目标 语言 的 语句 ,也 可 以 在 这 种 中 介 成 分 上 作 谓 词 演算 用 
于 特定 领域 。 语 义 结 构 分 为 三 层 : 模板 (templates)、 公 式 (formu- 
las) .元素 (elements) 。 其 中 ,元素 是 基本 的 语义 单位 ,包括 语义 特征 
(如 : MAN、THING、FEORCE CAUSE) 和 语义 格 ( 如 : SUBJ[ 施 
事 ]\OBJE[ 受 事 】]`POSS[ 领 属 ] \SOUR [来 源 ]`\GOALC 目 标 ]) 。 语 
义 元 素 构成 语义 公式 ,语义 公式 就 是 用 语义 元 素 表示 英语 的 词汇 意 
义 ; 每 一 个 义 项 设立 一 个 语义 公式 。 比 如 ， 

interrogate: ((MAN SUBJ) CCMAN 'OBJE) TELL 

FORCE))) 

审问 : 人 迫使 人 说 话 
语义 公式 构成 语义 模板 ,语义 模板 是 由 “ 施 事 -动作 - 受 事 ”构成 的 三 
元 组 合 ; 如 : MAN-DO-MAN,MAN-GIVE-THING 等 。 当 句子 有 
靶 义 时 ,要 进行 语义 优选 。 例 如 “The key is 得 thelock. ”lock 一 词 
有 “ 锁 2 和 “水闸 ”两 个 意思 ,在 本 例 中 都 讲 得 通 。 但 是 ,由 于 “ 锁 ? 和 
“钥匙 ?语义 联系 的 程度 高 ,因而 优选 “ 锁 ”。 对 于 某 些 歧义 的 情形 ,还 
需要 运用 常识 推理 才能 作出 判断 。Roger C. Schank 认为 人 脑 中 存 
在 着 某 种 概念 基础 (conceptual base) ,语言 理解 的 过 程 就 是 把 语句 
映射 到 概念 基础 上 去 的 过 程 。 概 念 基础 具有 完善 的 结构 ,人 往往 能 
根据 初始 的 输入 预期 可 能 的 后 续 信 息 。 句 法 分 析 对 语言 理解 的 用 处 
不 大 ,因为 语言 理解 需要 的 是 输入 名 的 意思 ,而 不 是 它 的 句法 结构 。 
计算 机 要 理解 语言 ,必须 模拟 人 的 心理 过 程 ; 要 像 人 一 样 根 据 上 下 
文 、 环 境 、 知 识 . 记 忆 等 作出 预期 (expectation), 从 而 获取 语义 。 句 法 
只 起 一 种 指引 的 作用 , 即 根据 某 些 输入 词语 形成 概念 结构 ,预期 它 的 
句法 形式 ,便于 查找 核实 。Schank (1973) 提 出 了 概念 从 属 (CConcep- 
tual Dependency,CD) 理 论 ,建立 了 了 MARIE 模型。 这 个 模型 用 同 义 
互 释 (paraphrase) 的 方式 来 检验 计算 机 对 自然 语言 的 理解 程度 。 即 
输入 一 句 话 , 要 求 计 算 机 用 另外 的 一 些 语句 来 解释 。CD 理论 提供 
一 组 原始 行为 (primitive act) 和 一 组 概念 及 其 相互 之 间 的 从 属 关 系 ， 
作为 构造 CD 表达 式 的 基础 。CD 中 的 原始 行为 有 : ATRANS( 抽 象 
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关系 的 转移 ,如 give) ,PTRANS( 物 理 位 置 的 转移 ,如 go) 等 十 几 个 ; 
有 六 种 概念 范畴 : 现实 世界 中 的 事物 PP 及 其 属性 PA 动作 ACT 
及 其 属性 AA、 还 有 时 间 和 方位 。 概 念 从 属 关系 有 : PP 仿 ACT( 施 事 
与 动作 之 间 的 施 动 关系 ),PP*>PA( 当 事 与 属性 之 间 的 描述 关系 ) 
等 。 比 如 “John gave Mary a book. ”的 CD 表达 式 ( 有 删 略 ) 是 : 


Mary 
John < 一 > PTRANS < 和 -一 一 book 
John 


每 个 动词 按照 从 属 关系 编 入 动词 词典 。 语 名 输入 ,根据 句法 指 
引 找 出 主要 的 名 词 和 动词 。 再 查 动 词 的 概念 从 属 关系 ,联系 句 中 的 
名 词 获得 语义 解释 。 比 如 ,输入 “John ate the steak. ”, 查 eat 条 的 注 
解 ( 有 删 略 ?为 : 


和 XX X: animal 
VtX > INGEST < 和 一 一 Y 
In Y food 


代入 句 中 名 词 就 得 到 这 个 句子 的 CD 表达 式 ( 有 删 略 ) ; 


Mary 
John < 一 > PTRANS < 近 - 一 一 book 
John 


上 述 这 些 不 同 的 理论 和 方法 ,都 是 基于 研究 者 对 于 “人 是 怎样 理 
解 语言 的 ?这 一 问题 的 不 同 见 解 而 发 展 出 来 的 。 也 就 是 说 ,他 们 分 别 
用 不 同 的 计算 范式 来 实现 其 认 知 范式 . 


4 实证 主义 取向 : 着 眼 于 检验 
语法 理论 的 可 靠 性 


跟 $1 所 述 的 抱 有 实用 目的 的 工程 主义 取向 不 同 , 大 多 数 计算 


@ 详 见 杨 抒 (1988) ,第 22 一 26 页 ; 范 继 淖 、 徐 志 敏 (1980) ,第 9 一 19 页 。 
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语言 学 研究 并 不 跟 某 种 特定 的 应 用 目标 相 挂钩 ,而 是 另 有 某 种 科学 
研究 的 目标 。 其 中 之 一 就 是 用 计算 机 来 对 语言 学 家 提出 的 各 种 语言 
学 理论 进行 检验 。 比 如 : 


One natural function for computational linguistics would 
be the _ testing of grammars proposed by theoretical 1lin- 
Grishman (1986) 8 1.1，p.5 

《计算 语言 学 的 一 个 自然 的 功能 是 对 理论 语言 学 家 提出 的 
各 种 语法 进行 检验 。) 


用 计算 机 来 检验 某 种 语法 理论 或 某 组 语法 规则 ,这 对 语言 学 家 来 说 
实在 是 一 件 既 令 人 兴奋 又 令 人 不 安 的 事 。 兴 奋 的 是 语言 学 的 理论 和 
规则 居然 可 以 像 数学 公式 一 样 让 计算 机 去 执行 ,不 安 的 是 能 顺利 通 
过 机 器 检验 的 希望 是 极其 泊 茫 的 。Friedman (1971) 还 真 的 设计 了 
一 个 检验 转换 生成 语法 的 系统 ,名 叫 Friedmany”s Transformational 
Grammar Tester。 该 系统 可 以 按照 转换 生成 语法 来 生成 句子 ,于 是 
语言 学 家 可 以 用 它 来 检验 他 们 的 语法 是 不 是 真 的 只 生成 合 语法 的 句 
子 。 事 实 上 ,由 于 大 多 数 语言 学 理论 的 形式 框架 (包括 : 移 位 规则 的 
性 质 、 对 转换 的 限制 .语义 解释 规则 的 形式 ,等 等 ) 都 是 有 问题 的 ,而 
且 理 论语 言 学 的 重点 并 不 是 建造 一 种 能 适应 计算 测试 的 实体 性 的 语 
法 ;因而 就 目前 来 看 ,作为 语言 学 理论 的 测试 工具 ,计算 机 的 用 处 是 
不 大 的 .9 1 

看 来 ,让 计算 语言 学 来 充当 语言 学 理论 的 审判 官 是 不 合适 的 ; 它 
会 导致 丙种 消极 的 后 果 : (iD 计算 语言 学 对 理论 语言 学 的 失望 和 抱 
怨 ,漠视 理论 语言 学 的 研究 成 果 , 撤 开 语言 学 家 的 工作 另 搞 一 套 ; 
(ii) 理论 语言 学 对 计算 语言 学 的 敌视 和 朴 远 ,拒绝 采用 计算 机 科学 
的 理论 .概念 和 方法 来 研究 语言 ,使 语言 学 研究 失去 一 种 丰富 的 理论 
营养 和 强劲 的 应 用 动力 。 更 为 现实 的 定位 是 : 把 计算 语言 学 看 作 理 
论语 言 学 和 计算 机 技术 的 桥梁 ,通过 计算 语言 学 家 的 工作 来 沟通 语 
言 学 理论 和 计算 机 技术 ,来 形成 语言 学 技术 (linguistic technology， 


guists. 


四 详 见 Grishman (1986)，p. 5. 
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如 : 针对 某 种 语法 体系 的 语法 解释 器 和 分 析 器 , 言语 合成 算法 等 )， 
从 而 完成 语言 学 理论 在 计算 机 上 的 应 用 。 因为 ,在 语言 学 理论 和 计 
算 机 处 理 技术 之 间 存 在 着 很 深 的 鸿沟 ,一般 的 语言 学 理论 研究 的 是 
抽象 的 语言 能 力 (competence), 即 理想 的 说 话 人 和 听话 人 的 内 在 的 
语言 知识 ;而 不 研究 具体 的 语言 运用 (performance), 即 语言 知识 在 
实际 的 语言 活动 中 是 怎样 运用 的 。 但 是 ,计算 机 只 能 处 理 活 动 和 过 
程 性 的 知识 。 因 此 ,计算 语言 学 一 直 在 尝试 通过 把 语言 学 理论 转变 
为 算法 ( 它 能 模拟 遵守 语言 学 理论 和 语言 能 力 语法 中 所 包含 的 各 种 
语言 学 限制 和 概括 的 语言 行为 ) ,来 沟通 语言 能 力 语法 和 某 种 要 适应 
用 机 器 处 理 的 特定 的 语言 运用 。@ 事实 上 ,更 大 的 矛盾 在 于 : 语言 学 
理论 基本 上 是 描述 性 的 ,而 计算 机 技术 中 的 算法 描述 和 编程 语言 则 
基本 上 是 过 程 性 的 。 下 面 ,我 们 简要 地 讨论 这 种 矛盾 及 其 解决 办 法 。 

一 般 地 说 ,计算 机 要 处 理 自然 语言 (最 终 目 的 是 抓 住 句子 的 意 
义 ) ,首先 必须 对 输入 句 进行 句法 分 析 (parsing), 从 没有 显 性 结构 标 
记 的 符号 串 上 找 出 结构 米 ; 即 识别 输入 名 的 各 个 构成 成 分 以 及 它们 
之 间 的 关系 ;比如 确定 句子 的 主要 动词 及 其 主语 和 宾语 ,确定 修饰 成 
分 及 其 中心 语 等 。 要 分 析 句 子 的 结构 就 需要 语法 的 指导 , 正 是 语法 
提供 了 一 种 语言 的 结构 成 分 和 符号 串 跟 结构 之 间 的 关系 的 明确 定 
义 。 在 计算 语言 学 上 ,通常 称 一 个 能 根据 一 部 特定 的 语法 来 分 析 句 
子 (确定 句子 的 推导 过 程 ) 的 程序 为 分 析 器 (parser)。 这 种 分 析 程序 
主要 涉及 两 部 分 内 容 : (i) 一 组 语法 规则 ,它们 由 某 种 形式 化 的 语法 
理论 组 织 在 一 起 ,形成 某 种 语法 形式 体系 (grammatical formalismy) ; 
(ii) 一 种 控制 机 制 Ccontrol mechanism) , 它 决定 在 分 析 过 程 中 怎样 
运用 语法 规则 、 怎 样 保持 对 于 各 种 业已 发 现 的 成 分 的 记录 、 使 程序 在 
有 限 步 运算 后 找 出 结构 , 即 形成 某 种 分 析 算 法 (parsing algorithms) 。 
大 家 知道 ,程序 是 用 编程 语言 (programming languages) 编 写 的 。 而 
编程 语言 基本 上 是 过 程 性 的 表示 体系 (Cprocedural representation ) ， 
因为 编程 的 目的 本 来 就 是 给 计算 机 提供 一 套 明确 而 详尽 的 怎样 干 某 
事 的 指令 (instruetions) 。 但 是 ,语法 规则 通常 都 是 陈述 性 的 (declar- 


四 ” 详 见 Halvorsen (1988) ,pp. 200 一 201. 
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ative) ,而 不 是 过 程 性 的 ; 它 可 以 告诉 我 们 一 个 句子 往往 由 一 个 NP 
和 一 个 VP 构成 ,但 并 不 告诉 我 们 怎样 用 一 个 NP 和 一 个 VP 去 构成 
一 个 句子 。 面 对 这 种 语言 学 理论 和 计算 机 技术 之 间 的 不 适 配 , 有 两 
种 解决 问题 的 思路 : 第 一 种 ,把 陈述 性 的 语法 形式 体系 改变 为 过 程 
性 的 语法 形式 体系 ,用 过 程 性 的 形式 体系 来 表示 和 组 织 语法 规则 。 
比如 ,利用 转移 网 络 这 种 形式 机 制 的 RTN 语法 (recursive transition 
network grammar) 和 ATN 语法 就 是 一 种 过 程 性 的 语法 体系 。 例 
如 ,下 面 是 一 部 小 型 的 上 下 文 无 关 语 法 的 三 条 规则 及 相应 的 三 个 转 
移 网 络 ; 


SS 人 NE 二 入 卫 
NP-~Det 十 N 
VE=V 十 NP 


NP VP 


四 冯 间 
ee 


NP 


可 见 ,RTN 由 一 组 子 网 络 组 成 。 每 个 子 网 络 由 一 组 状态 构成 ,表示 
一 种 句法 范畴 (如 SNP、VP 等 ,其 后 的 数字 是 该 范畴 的 状态 编号 ); 
不 同 的 状态 之 间 用 带 箭头 的 弧 线 连结 , 弧 线 上 面 标明 该 范畴 的 组 成 
成 分 的 句法 范畴 (如 Det\N 等 )。 在 RTN 中 ,任何 一 个 子 网 络 都 可 
以 调用 包括 自己 在 内 的 任何 子 网 络 。 比 如 ,上 图 中 S 子 网 络 要 调用 
NP、VP 子 网 络 ,VP 子 网 络 要 调用 NP 子 网 络 。RTN 基本 上 等 价 于 
一 部 上 下 文 无 关 语法 ( 即 短语 结构 语法 )。 
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一 个 RTN 可 以 看 作 是 一 组 地 图 ,它们 指引 着 你 去 发 现 句 子 是 
怎样 由 短语 构成 的 .短语 是 怎样 由 词 构 成 的 。 因 此 ,RTN 语法 是 一 
种 过 程 性 的 形式 体系 。ATN (augmented transition network ) 则 是 
对 RTN 的 扩充 , 它 通 过 增加 一 组 寄存 器 来 储存 分 析 过 程 中 得 到 的 
中 间 结 果 ( 如 局 部 句法 树 ) 和 有 关 信 息 ( 如 名 词 短 语 的 人 称 和 数 、 某 些 
语言 成 分 的 语义 特征 等 ) ,还 在 每 条 弧 上 附加 任意 的 条 件 测试 (符合 
条 件 , 即 测试 成 功 才 能 通过 这 条 弧 ) 和 动作 ( 当 通 过 一 条 弧 时 ,相应 的 
动作 便 依次 执行 ;这 些 动作 主要 用 来 设置 和 修改 寄存 器 的 内 容 )。 正 
是 这 种 条 件 和 动作 ,使 得 ATN 这 种 表示 方式 从 语法 形式 体系 转变 
为 一 种 分 析 算 法 。 但 是 ,这 种 扩充 破坏 了 语法 形式 体系 的 陈述 性 的 
本 质 , 同 时 用 ATN 的 分 析 器 在 控制 策略 的 使 用 上 备 受 限制 ;因此 ， 
近年 来 这 种 分 析 器 已 经 不 太 时 兴 了 。 第 二 种 思路 是 ,把 过 程 性 的 编 
程 语 言 改变 为 陈述 性 的 编程 语言 ,用 陈述 性 的 表示 体系 (逻辑 形式 ) 
来 描述 问题 ; 即 只 告诉 机 器 要 解决 什么 问题 ,但 不 说 怎样 去 解决 ,让 
机 器 用 定理 证 明 的 办 法 .通过 自动 推理 去 获得 这 方面 的 信息 。Pro- 
log 就 是 这 样 一 种 基于 逻辑 推理 的 程序 设计 语言 ,这 种 逻辑 程序 设 
计 语 言 (logic programming language) 是 一 种 陈述 性 (表示 问题 ) 语 
言 , 其 控制 (如 何 求解 ) 过 程 由 逻辑 程序 设计 系统 本 身 实现 ,无 须 程序 
设计 人 员 给 出 解 题 算法 。 于 是 ,为 了 充分 利用 这 种 编程 语言 的 内 在 
特性 ,基于 Prolog 的 分 析 器 应 该 把 所 要 分 析 的 问题 看 作 是 一 个 定理 
证 明 的 问题 。 所 有 这 类 用 便于 Prolog 编译 的 方式 来 表示 语言 学 规 
则 的 语法 形式 体系 ,都 叫做 逻辑 语法 (logic grammar)。 其 中 ,限定 
子 句 语法 (Definite Clause Grammar，DCG ) 就 是 一 种 逻辑 语法 。 
DCG 是 一 种 增强 的 上 下 文 无 关 语 法 (Augmented Context-Free 
Grammar) , 它 的 生成 能 力 不 低 于 ATN 语法 。 更 为 重要 的 是 ,用 限 
定子 句 表示 的 语法 规则 本 身 就 是 逻辑 程序 设计 语言 Prolog 的 可 执 
行程 序 。 换 句 话说 ,Prolog 系统 可 以 直接 解释 用 DCG 形式 表示 的 
语法 规则 ,而 无 需 像 ATN 那样 另外 再 设计 一 个 句法 分 析 器 (规则 解 
释 程序 ) 来 完成 这 个 任务 。 下 面 , 我 们 来 看 一 部 简单 的 上 下 文 无 关 语 
法 是 怎样 用 DCG 这 种 形式 体系 来 描述 的 : 


sentence->noun-phrase，verb-phrase 
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noun-phrase->determiner，noun 
verb-phrase->trans-verb，noun-phrase 
determiner->[the] 

noun->[man]] 

noun->[wine]] 


trans-verb->[1likes] 


Prolog 系统 可 以 把 这 样 书写 的 DCG 规则 直接 翻译 成 Prolog 可 
执行 程序 ,例如 : 


Sentence (X，Y) : 


noun-phrase (X，Z)， 

verb-phrase (Z，Y). 

determiner (X，A)， 

noun (A，Y). 

trans-verb (X，A)， 
noun-phrase (A，Y). 

determiner ([the|X]，X). 

noun ([man|X]，X). 

noun ([wine|X]，X)， 

trans-verb ([likes|X], X). 


在 Prolog 的 规则 中 ,每 个 非 终结 符 都 被 改写 为 具有 两 个 变 元 的 复合 
项 。 其 中 ,每 个 变 元 都 是 一 张 表 ,并 且 第 二 个 变 元 是 第 一 个 变 元 的 余 
表 。 例 如 ,输入 句子 “The man likes wine. ”可 表示 为 目标 ， 


noun-phrase (X，Y) 


verb-phrase (X，Y) , 


? 一 Sentence (the，man，likes，wine],，[ ])， 
yes 

? 一 noun-phrase (Lthe，man，likes，wine]，X). 
X 王 [likes，wine] 


第 一 个 问题 问 词 串 [the，man，1likes，wine] 是 不 是 一 个 句子 ,机 器 回 
答 是 ;第 二 个 问题 问 在 同一 词 串 中 扣除 什么 就 是 一 个 名 词 短 语 , 机 器 
回答 扣除 余 串 [likes，wine]。 可 见 , 计 算 机 技术 和 语言 学 理论 是 相 
互 影响 ,相互 促进 的 。 这 造成 了 计算 语言 学 和 理论 语言 学 的 紧密 合 
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作 , 并 且 产 生出 丰硕 的 成 果 。 比 如 ,广义 短语 结构 语法 (Generalized 
Phrase _ Structure GrammaryGPSG) 和 词汇 功能 语法 (Lexical Func- 
tional Grammar,LFG) 都 是 陈述 性 的 语法 形式 体系 ,它们 都 受到 ML. 
Kay(1979) 的 计算 语言 学 著作 DUzzz Facaotionz Grazzzaa7( 合 一 语法 ) 的 
影响 。 其 中 ,LFG 是 理论 语言 学 家 (J. Bresnan) 和 计算 语言 学 家 
CR. Kaplan) 的 合作 成 果 ,GPSG 的 部 分 作者 担任 过 大 型 的 计算 语言 
学 项 目的 顾问 。 随 着 这 种 理论 语言 学 和 计算 语言 学 的 会 聚 (conver- 
gence) ,也 有 许多 计算 语言 学 项 目 采 用 GPSG 或 LFG 作为 其 语法 形 
式 体系 ,从 而 实现 了 从 语言 学 理论 到 计算 机 技术 的 转变 .9 


s 逻辑 主义 取向 : 着 眼 于 语言 学 
知识 的 自动 发 现 


值得 注意 的 是 ,最 近 出 版 的 一 些 计算 语言 学 著作 ,作者 在 计算 语 
言 学 的 定义 中 特意 强调 了 语言 的 计算 结构 和 计算 模型 。 例 如 4: 


(1) 计算 语言 学 旨 在 以 自然 语言 处 理 ( 包 括 理 解 、 生 成 人 

机 对 话 、 机 器 翻译 以 及 语音 /文字 输入 的 后 处 理 等 ) 为 技术 背景 ， 

揭示 自然 语言 的 词法 、 名 法、 语义、 语 用 诸 平面 及 其 相互 作用 的 
计算 结构 ,把 语言 学 知识 重 塑 成 可 以 转化 为 产品 的 计算 模型 。 

一 -一 白 硕 (1995) ,第 2 页 

(2) 现代 计算 语言 学 是 通过 建立 形式 化 的 计算 模型 来 分 

析 、 理 解 和 处 理 语 言 的 学 科 。 ……… 广义 地 讲 ， 计 算 语言 学 是 研究 

字符 串 的 结构 以 及 结构 和 意义 的 关系 的 学 科 。 

一 一 公 富 良 、 王 野 记 (1998) ,第 1.9 页 。 

按照 白 硕 (1995) 的 理解 ,要 建造 一 个 处 理 自 然 语言 的 计算 机 系 

统 ,必须 有 大 量 的 语言 学 知识 作 后 盾 ; 但 是 ,语言 学 知识 的 发 现 工作 

主要 是 以 手工 的 方式 进行 的 。 因 此 ,利用 计算 机 来 自动 (或 辅助 ) 发 


四 以 上 内 容 详 见 Halvorsen (1988), pp. 204 一 210; Gazdar & Mellish (1987 ) ， 
pp. 228 一 229,pP. 229 一 235; 石 纯 一 等 (1993) ,第 64 一 68 页 ;第 333- 一 422 页 。 
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现 语言 学 知识 ,将 极 大 地 提高 研究 的 效率 .扩大 研究 的 规模 、 把 语言 
学 家 从 收 例句 、 制 卡片 ` 画 表格 等 烦琐 的 事务 中 解放 出 来 。 可 见 , 研 
究 语 言 学 知识 的 计算 机 辅助 发 现 系统 ,是 计算 语言 学 的 一 个 别 开 生 
面 的 研究 方向 ;这 种 工作 不 仅 有 助 于 我 们 以 计算 机 为 模型 来 研究 儿 
童 语 言 习 得 ,而 且 对 于 开发 自然 语言 处 理 系统 也 具有 实用 的 价 
值 一 一 一 个 语言 学 知识 的 计算 机 辅助 发 现 工 具 实 际 上 相当 于 一 个 使 
自然 语言 处 理 系 统 具 有 自 扩 充 、 自 维护 功能 的 高 级 开发 工具 。 所 谓 
语言 学 知识 的 发 现 , 指 的 是 从 一 个 由 例句 组 成 的 语料库 中 发 现 特定 
的 自然 语言 规律 。 这 种 从 一 组 事例 中 发 现 一 般 规 律 的 认 知 活动 ,在 
逻辑 上 被 描述 成 一 种 归纳 ?过 程 。 但 是 ,历来 对 于 归纳 的 研究 跟 逻 
辑 是 脱节 的 ,特别 是 对 于 语言 学 知识 的 发 现 的 逻辑 实质 的 研究 是 十 
分 缺少 的 。 作 者 决心 研究 语言 学 规则 这 种 特殊 形式 的 知识 的 发 现 的 
逻辑 实质 ,全 面 地 展示 跟 语 言 学 知识 发 现 有 关 的 各 个 层次 上 的 形式 
化 机 制 一 一 从 数学 建 模 .逻辑 分 析 、 算 法 描述 .具体 实现 直到 结果 的 
语言 学 解释 。 作 者 采用 语言 学 中 经 典 的 分 布 分 析 的 思想 ,并 针对 真 
实 语 料 的 各 种 特点 ,结合 汉语 的 实际 ,从 数学 .逻辑 .算法 以 及 实现 各 
个 角度 ,全面 阑 述 了 从 语 料 中 发 现 确定 性 语言 学 知识 (主要 是 词类 和 
句法 规则 ) 的 理论 和 方法 。 作 者 首先 从 数学 角度 讨论 了 分 布 理 论 的 
完善 和 推广 ,分 别 在 词 、 短语 、 词 结 (word complex, 即 超 距 相关 的 实 
词 多 元 组 ,long-distance dependent word n-tupple, 如 :英语 我 十 年 
前 就 会 说 了 ”中 的 “英语 ……: 说 沁 ) 的 刻 类 问题 上 引入 分 布 分 析 方 法 。 
作者 在 讨论 词类 及 其 划分 的 数学 理论 时 ,提出 了 词类 划分 的 不 动 点 
理论 .指出 分 布 分 析 的 任务 是 求解 最 大 不 动 点 , 泪 清 了 语言 学 界 有 关 
分 布 分 析 中 含有 ”“ 逮 辑 循环 ”的 误解 .证 明了 最 大 不 动 点 在 极限 意义 
下 的 可 计算 本 性 .明确 了 分 布 分 析 方法 的 两 个 基本 的 逻辑 前 提 : 词 
的 同一 性 和 语言 边界 的 明确 性 ,从 而 解决 在 词类 问题 上 “发 现 什 么 ” 
和 ”能 和 否 发 现 ? 两 大 问题 。 在 讨论 发 现 句法 规则 的 数学 理论 时 ,作者 
用 构造 性 的 方法 建立 一 个 基于 名 型 推 衍 的 变换 规则 系统 ,用 以 说 明 
什么 是 基本 名 型 和 怎样 从 一 些 句 型 得 到 另外 一 些 句 型 ;其 中 , 推 衡 规 
则 包括 名 型 推 衍 规则 和 环境 推 衔 规则 ,它们 都 是 重 写 规则 (rewrite 
rules) ;并 阐明 这 种 规则 发 现 系 统 跟 分 布 分 析 的 关系 : 同 分 布 关系 和 
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作为 重 写 规则 的 推 衍 规则 在 本 质 上 都 是 一 种 “替换 ”。 就 这 样 , 作 者 
从 词 的 分 布 分 析 推 广 到 了 短语 结构 的 分 布 分 析 , 接 下 来 他 又 把 分 布 
分 析 推 广 到 词 结 。 作 者 发 现 如 果 两 个 词 结 是 同 分 布 的 ,那么 它们 一 
定 同 时 满足 或 不 满足 任何 一 个 变换 ;所 以 变换 是 实 词 多 元 组 和 多 元 
句法 环境 之 间 的 一 种 推 衍 关 系 , 词 结 是 变换 下 的 不 变量 .多 元 环境 的 
填充 物 ,而 多 元 环境 则 是 某 一 句法 结构 中 抠 掉 了 词 结 的 剩余 部 分 ;由 
于 词 结 是 以 各 种 不 同 的 多 元 环境 作为 分 布 框架 的 ,因而 变换 分 析 就 
是 词 结 的 分 布 分 析 ,通过 变换 分 析 可 以 给 词 结 进行 分 类 。 这 样 ,句子 
可 以 看 作 是 由 词 结 加 上 环境 构成 的 ,句子 语义 恰好 可 以 分 解 为 词 结 
的 语义 加 上 环境 的 语义 。 比 如 : 


“ 河 不 过 了 ?”, 指 的 是 撤销 “过 河 " 的 意愿 
“ 饭 不 吃 了 ”, 指 的 是 撤销 “吃饭 "的 意愿 。 


多 元 环境 “不 …… 了 ?的 语义 为 “实现 事件 王 的 愿望 撤销 了 ”, 加 上 由 
词 结 * 过 …… 河 、 吃 …… 饭 ”的 意义 正好 是 句子 的 意义 。 作 者 甚至 希 
望 通过 词 结 的 分 布 分 析 , 来 归纳 词 结 中 的 从 属 成 分 的 语义 格 ;其 根据 
是 词 结 的 同 分 布 类 跟 内 部 语义 角色 关系 和 外 部 组 合 能 力 相 同 的 语义 
结构 类 是 大 致 对 应 的 ,这 样 , 同 分 布 的 词 结 的 相同 位 置 上 的 从 属 成 分 
的 语义 格 是 相同 的 ;比如 ,上 例 中 “ 河 、 饭 ?的 语义 格 是 一 致 的 。 接 着 ， 
作者 讨论 了 语言 学 知识 发 现 的 逻辑 基础 ,提出 了 一 个 进行 逻辑 聚 类 
的 类 似 缺 省 逻辑 (default logic) 的 非 单调 形式 演算 系统 ,用 以 解决 在 
分 布 知识 不 完全 的 情况 下 进行 分 布 分 析 的 逻辑 聚 类 方法 及 其 逻辑 合 
理性 问题 。 在 此 基础 上 ,作者 提出 了 语言 学 知识 发 现 的 两 种 实现 算 
法 : 交互 式 聚 类 和 无 反例 聚 类 。 前 者 是 增 量 式 的 ,符合 语言 学 家 的 
工作 习惯 一 一 提出 各 种 正 例 和 反例 来 发 现 区 别 , 细 化 一 个 业已 存在 
的 规则 系统 ;后 者 是 批量 式 的 ,符合 语言 工程 师 的 工作 习惯 一 一 把 一 
个 没有 反例 的 大 语料库 交 给 计算 机 去 运行 ,中 间 不 作 任何 干预 ,只 管 
到 时 候 取 结 果 。 从 而 ,在 技术 上 解决 了 词类 等 语言 学 知识 如 何 发 现 
的 问题 。 最 后 ,作者 用 交互 式 算法 建立 了 一 个 实验 系统 CASD 一 1， 
算是 对 上 述 理论 的 实践 或 检验 。 这 是 一 个 面向 汉语 的 词类 划分 系 
统 , 它 通 过 对 例句 文件 中 具有 代表 性 的 66 个 例句 (47 个 正 例 .19 个 
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反例 ) 的 分 析 , 通 过 变换 和 把 体 词性 成 分 抽象 为 词类 范畴 来 构造 名 
式 , 再 通过 人 机 界面 请 人 判断 正 误 以 获取 分 布 信息 ,结果 该 系统 分 出 
动词 的 15 个 分 布 上 的 小 类 ;比如 ， 送 、 嫁 、 卖 ”是 一 类 ， 炒 、 织 准备 ” 
是 一 类 。 接 着 ,作者 考察 这 15 个 小 类 的 语言 学 意义 ,发 现 每 一 类 动 
词 都 有 独特 的 句法 分 布 ( 比 如 ,能 和 否 进 入 双 宾 名 式 、 能 和 否 后 附 “ 着 2)、 
语义 上 它们 有 独特 的 格 角色 结构 ( 论 元 结构 ,比如 ,其 主语 位 置 上 的 
NP 是 施 事 还 是 处 所 、 其 宾语 位 置 上 的 NP 是 受 事 还 是 结果 )、. 语 用 上 
它们 隐 含 独特 的 预 设 集合 (比如 ， 送 ?类 动词 表示 的 给 予 事件 的 预 设 
是 : 事件 发 生前 , 受 事 为 施 事 所 有 ;事件 发 生 后 , 受 事 为 与 事 所 有 )。 
这 种 计算 语言 学 工作 对 语言 学 家 来 说 是 比较 亲切 的 ,因为 它 在 相当 
程度 上 模拟 了 语言 学 家 发 现 语言 学 规则 的 过 程 。 

白 硕 (1995) 的 研究 有 着 明显 的 逻辑 主义 追求 , 那 就 是 通过 研究 
语言 学 知识 的 发 现 来 探索 归纳 法 的 逻辑 机 制 和 计算 结构 。 一 般 地 
说 ,从 逻辑 上 看 ,人 类 的 思维 活动 不 外 基于 演绎 法 和 基于 归纳 法 两 
类 。 演 绎 法 常常 是 从 一 些 多 少 已 经 抽象 化 :形式 化 的 前 提出 发 ,演绎 
出 种 种 结论 来 。 只 要 前 提 中 含有 可 以 互相 消解 Cresolve) 的 对 象 , 就 
一 定 可 以 衡 生 出 新 的 命题 来 。 显 然 , 从 前 提 演 绎 出 结论 是 计算 机 可 
以 胜任 的 工作 。 而 归纳 法 常常 是 从 未 充分 抽象 化 ` 形 式 化 的 大 量 个 
别 事 例 出 发 ,希望 从 中 抽象 出 有 用 的 概念 ` 模 式 、 定 理 来 。 这 种 工作 
能 不 能 用 计算 机 来 完成 呢 ? 由 于 在 使 用 归纳 法 的 时 候 ( 比 如 ,划分 词 
类 、 发 现 句法 模式 等 ), 目标 的 确立 .是 否 达 到 目标 的 判别 .达到 目标 
的 手段 的 建立 等 都 是 通过 反复 尝试 而 逐步 建立 起 来 的 。 对 于 这 种 缺 
少 确 定性 的 过 程 ,计算 机 是 很 难 单独 完成 的 。 怎 么 办 呢 ? 答案 是 建 
立 一 个 人 机 共生 的 系统 ,由 人 来 负责 设 定 目标 和 手段 .由 机 来 负责 实 
现 这 种 手段 而 不 管 目 标 是 什么 。 如 果 有 了 这 样 的 人 机 共生 系统 ,就 
可 以 大 大 地 提高 工作 的 效率 和 质量 。 要 想 做 到 这 一 点 ,就 必须 进 一 
步 研究 归纳 的 手段 和 逻辑 机 理 。 而 白 硕 (1995) 主要 是 以 语言 学 问题 
为 背景 ,提出 许多 关于 归纳 的 概念 和 方法 作为 人 机 共生 系统 的 基 
础 .了 他 特别 强调 归纳 的 非 单调 性 、 可 错 性 的 特点 : 已 经 归纳 出 来 的 
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规则 总 有 可 能 被 后 来 的 事实 证 明 是 不 正确 的 、 需 要 修改 的 ,然而 在 没 
有 遇 到 这 样 的 事实 时 ,这 些 规 则 又 可 以 认为 是 近似 正确 的 \ 不 妨 使 用 
的 。 作 者 就 是 用 这 种 允许 某 种 “逻辑 跳 妈 来 达到 一 些 好 的 猜测 的 方 
法 来 发 现 词 类 和 句法 规则 ,并 希望 这 种 机 制 不 仅仅 局 限于 语言 学 知 
识 的 发 现 , 希 望 这 种 研究 对 于 探索 知识 发 现 的 一 般 途 径 \ 对 于 认识 归 
纳 和 类 比 的 逻辑 实质 有 所 贡献 。 

从 方法 论 和 哲学 背景 上 看 ,计算 语言 学 研究 有 理性 主义 和 经 验 
主义 两 大 分 野 。 理 性 主义 方法 认为 : 人 的 很 大 一 部 分 语言 知识 是 与 
生 俱 来 的 ; 即 是 由 遗传 决定 的 。 受 Chomsky 内 在 语言 官能 (innate 
language faculty) 学 说 的 影响 ,计算 语言 学 界 很 多 人 信奉 理性 主义 。 
他 们 秉承 人 工 智 能 研究 中 的 符号 主义 传统 ,通过 人 工 汇 编 初 始 语言 
知识 (主要 表示 成 形式 规则 ) 和 推理 系统 来 建立 处 理 自然 语言 的 符号 
系统 。 这 种 系统 通常 根据 一 套 规 则 或 程序 ,将 自然 语言 “理解 ?为 某 
种 符号 结构 ;再 通过 某 种 规则 ,从 组 成 该 结构 的 符号 的 意义 上 推导 出 
该 结构 的 意义 。 在 一 个 典型 的 自然 语言 处 理 系统 中 , 句法 分 析 器 
(parser) 按 照 人 所 设 定 的 自然 语言 的 语法 把 输入 名 分 析 为 句法 结构 
(一 种 特定 形式 的 符号 结构 ) ,再 根据 一 套 语 义 规 则 把 语法 符号 结构 
映射 到 语义 符号 结构 (如 : 逻辑 表示 、 语 义 网 络 . 中 间 语 言 等 )。 由 于 
自然 语言 处 理 系统 中 的 规则 集 通 常 是 先 验 的 , 即 是 由 人 设计 好 以 后 
赋予 机 器 的 ;因而 ,这 是 一 种 典型 的 理性 主义 的 方法 。 经 验 主义 方法 
认为 : 人 的 知识 只 有 通过 感官 传人 再 通过 一 些 简单 的 联想 (associ- 
ation) 和 泛 化 (generalization) 的 操作 才能 获得 ,人 不 可 能 天 生 拥 有 一 
套 有 关 语 言 的 原则 和 处 理 方法 。 表 现在 计算 语言 学 中 ,许多 研究 尝 
试 从 大 量 的 语言 数据 中 获取 语言 的 结构 知识 ,从 而 开辟 了 基于 语 料 
库 的 计算 语言 学 这 种 经 验 主义 的 研究 方法 。 其 中 的 神经 网 络 方法 秉 
承 了 人 工 智 能 研究 中 的 连结 主义 传统 ,由 机 器 通过 学 习 给 定 的 实例 
(训练 数据 ) 之 间 的 输入 -输出 关系 ,来 获得 神经 元 (人 工 神经 节点 ) 之 
间 的 连结 强度 Cstrength ,或 称 “ 权 ”weight), 以 反映 从 输入 状态 到 输 
出 状态 之 间 的 映射 关系 。 其 中 的 统计 学 方法 试图 建立 统计 性 的 语言 
处 理 模 型 ,并 由 语料库 中 的 训练 数据 来 估计 统计 模型 中 的 参数 。 比 
如 ,8$ 2 中 介绍 的 词类 的 自动 标注 ,其 做 法 是 先 使 用 少量 已 经 人 工 标 
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注 的 语 料 进行 训练 ,然后 将 学 到 的 词类 标记 的 共 现 概率 分 布 用 于 标 
注 尚未 标注 的 文本 。 这 都 是 通过 学 习 训 练 实例 来 获得 某 种 语言 处 理 
能 力 的 ,因而 是 典型 的 经 验 主 义 的 研究 方法 . 简 而 言 之 ,理性 主义 
强调 基于 规则 的 方法 ,经 验 主 义 强 调 基 于 学 习 的 方法 。 而 和 白 硕 
《1995) 的 工作 则 尝试 兼 采 这 两 种 方法 之 长 又 避免 这 两 种 方法 之 短 。 
粗略 地 说 ,这 是 一 种 企图 发 现 规则 而 不 是 赋予 规则 、 基 于 语料库 但 不 
拘 于 统计 学 方法 的 路 子 。 作 者 考虑 到 仅 靠 统计 学 方法 是 无 法 从 语 料 
中 发 现 确定 性 的 语言 学 规则 的 ,因而 尝试 一 种 从 精炼 语料库 中 动态 
地 归纳 规则 的 方法 。 这 种 从 语料库 中 通过 学 习 来 获得 符号 处 理 系统 
中 的 规则 集 的 方法 ,在 本 质 上 是 归纳 逻辑 。 这 种 方法 一 方面 用 到 符 
号 处 理 系 统 中 的 规则 表达 ,但 规则 又 是 从 语料库 中 经 验 地 获得 的 ; 因 
而 ,就 其 本 性 而 言 是 一 种 经 验 主义 的 方法 .9 

从 语言 学 的 角度 看 , 白 硕 (1995) 给 人 印象 最 深 的 是 : 对 分 布 这 
一 概念 的 实质 的 揭示 、 对 分 布 分 析 方法 的 全 面 推广 。 白 硕 (1995 ,第 
111 一 112 页 ) 指 出 ,分 布 是 一 个 十 分 深刻 的 语言 学 概念 ,分 布 概念 的 
实质 就 是 某 些 语言 学 对 象 在 特定 含义 下 的 可 替换 性 。 有 了 可 替换 
性 ,这 些 语法 功能 一 致 的 语言 学 对 象 才能 聚集 成 类 , 才 有 可 能 总 结 出 
能 概括 普遍 语言 现象 的 规则 。 因 此 ,在 句法 范畴 和 句法 规则 的 发 现 
过 程 中 ,分 布 分 析 的 方法 起 着 核心 的 ,决定 性 的 作用 。 从 数学 上 看 ， 
分 布 分 析 的 实质 是 等 价 类 划分 。 要 进行 等 价 类 划分 ,就 要 定义 相应 
的 等 价 关 系 , 即 所 谓 的 同 分 布 关 系 。 同 分 布 关系 的 定义 取决 于 环境 
的 定义 ,而 定义 环境 又 需要 有 一 个 初始 的 等 价 类 划分 。 于 是 就 需要 
一 整套 的 不 动 点 理论 使 分 布 分 析 走 出 “逻辑 循环 ”的 陷阱 。 分 布 分 析 
不 仅 能 发 现 句法 范畴 ,而 且 能 发 现 句 法 规则 。 由 于 句法 规则 是 一 种 
重 写 规则 ,而 重 写 就 是 蔡 换 ;在 这 里 ,被 替换 的 恰恰 是 短语 结构 。 因 
而 , 正 是 在 鞭 换 这 一 点 上 ,句法 规则 的 发 现 注定 要 回 到 分 布 分 析 那 儿 
去 寻找 工具 ;结果 ,形成 了 关于 短语 结构 的 分 布 分 析 的 两 种 方法 : 一 
种 是 连续 的 短语 结构 的 分 布 分 析 , 这 不 过 是 把 词 的 分 布 分 析 推 广 到 


〇 O 详 见 翁 富 良 、 王 野 (1998) ,第 4 一 8 页 。 
Q@ 详 见 白 硕 (1995) ,第 1 一 5 页 ; 翁 富 良 、 王 野 闪 (1998) ,第 4 一 8 页 。 
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短语 上 去 ;一 种 是 不 连续 的 短语 结构 ( 即 词 结 ) 的 分 布 分 析 ,这 就 是 变 
换 分 析 , 藉 此 可 以 发 现 语义 关系 不 变 的 一 组 实 词 ( 即 词 结 ) 在 多 种 句 
法 环境 中 的 分 布 。 这 在 方法 论 上 ,对 语言 学 研究 无 疑 是 有 很 大 的 启 
示 作 用 的 。 其 实 , 在 语言 学 界 也 有 人 想 揭 示 分 布 分 析 跟 变换 分 析 之 
间 的 关系 。 比 如 , 喜 航 林 (1989, 8$ 3) 指 出 ,变换 分 析 方 法 是 建立 在 结 
构 主 义 关 于 “焦点 十 语 境 ” 的 分 布 理 论 之 上 的 。 变 换 分 析 无 非 是 通过 
由 变换 式 提供 的 各 种 新 语 境 来 反映 某 种 焦点 类 的 分 布 特征 ,揭示 其 
语法 特性 及 其 对 句 式 的 影响 。 但 是 , 袁 钞 林 (1989) 所 谓 的 焦点 类 只 
包括 句法 结构 中 起 关键 作用 的 词 和 短语 , 白 硕 (1995) 则 推广 到 词 结 
这 种 不 连续 的 句法 结构 。 不 过 , 白 硕 (1995) 把 词 结 定义 为 超 距 相 关 
的 实 词 多 元 组 ,这 显然 缺少 操作 上 的 规定 性 。 在 实际 工作 中 人 们 无 
法 决定 一 个 句子 中 的 哪些 实 词 应 该 算 作 一 个 词 结 。 这 方面 , 配 价 语 
法 (Valency Grammar) 理 论 也 许 能 帮 上 一 点 忙 。 根 据 圳 航 林 (1998， 
8$ 3. 4) , 价 反映 了 动词 对 其 他 词 项 的 支配 能 力 , 具 有 不 同 的 支配 能 力 
的 动词 有 不 同 的 价 ;”…… 价 反映 了 动词 的 某 种 分 布 状 况 一 一 它 到 底 
能 跟 多 少 、. 哪 些 从 属 成 分 共 现 ;或 者 说 , 价 是 对 动词 的 某 种 分 布 的 集 
约 化 表示 用 数字 来 反映 动词 能 跟 多 少 从 属 成 分 共 现 (第 87 页 )。 
也 许 ,我 们 可 以 把 词 结 具 体 地 规定 为 : 动词 等 谓词 跟 其 从 属 成 分 构 
成 的 实 词 多 元 组 。 这 样 , 配 价 语法 关于 动词 等 谓词 性 成 分 的 价 数 ( 能 
支配 多 少 从 属 成 分 )、 价 质 ( 这 些 从 属 成 分 的 语义 角色 是 什么 信 配 位 
方式 (同一 谓词 的 语义 格 不 同 的 从 属 成 分 的 同 现 限 制 关 系 、 施 事 和 受 
事 等 语义 成 分 跟 主 语 和 宾语 等 句法 成 分 的 连接 关系 ) 等 ,9 都 可 以 为 
进一步 充实 和 发 展 词 结 学 说 提供 支持 。 


6 结语 : 并 非 悖 论 一 一 用 计算 机 和 
为 计算 机 研究 语言 


最 近 几 年 ,国际 计算 语言 学 界 对 计算 语言 学 的 定义 逐步 形成 下 


@  ， 详 见 袁 航 林 (1998) 第 二 、 三 章 。 
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面 这 种 共识 : 
计算 语言 学 是 用 计算 机 和 为 计算 机 研究 语言 的 学 科 。 

说 计算 语言 学 的 特点 是 “用 计算 机 ”(by computer) 来 研究 语言 ， 
这 既 有 其 通俗 易 伐 的 一 面 ,又 有 其 浅显 误导 的 一 面 。 其 通俗 性 表现 
在 : 人 们 很 容易 想到 计算 语言 学 是 把 计算 机 作为 工具 来 使 用 的 , 比 
如 用 计算 机 收集 语 料 、 分 类 整理 .分 布 统计 、 提 取 各 种 数据 等 。 这 跟 
化 学 .物理 学 .生物 学 中 的 计算 化 学 、 计 算 物 理学 .计算 生物 学 有 点 相 
近 , 它 们 或 者 运用 简单 的 方程 和 算法 在 计算 机 上 进行 大 量 的 重复 运 
算 ,或 者 用 计算 机 对 实验 结果 进行 十 分 精细 的 计算 分 析 、 反 复 提高 以 
得 到 一 种 新 的 理论 。 其 误导 性 表现 在 : 人 们 只 想到 用 计算 机 这 种 电 
子 装置 作为 语言 研究 的 工具 ,而 忽略 了 用 计算 机 科学 的 理论 .概念 和 
方法 来 研究 语言 这 一 点 。 我 们 认为 这 一 点 才 是 计算 语言 学 更 本 质 、 
更 深刻 的 特点 。 像 $ 5 介绍 的 白 硕 (1995) 用 理论 计算 机 科学 的 观点 
剖析 当代 语言 学 的 方法 .并 进行 计算 模拟 的 做 法 ,在 一 定 程 度 上 展示 
了 这 类 研究 的 理论 魅力 和 实用 价值 。 在 这 方面 ,计算 神经 科学 
《computational neuroscience) 为 我 们 提供 了 一 个 光辉 的 典范 。 作 为 
神经 科学 的 一 个 新 的 分 支 ,计算 神经 科学 通过 建立 脑 模型 来 阐明 神 
经 系统 信息 加 工 的 计算 原理 ,以 了 解 大 和 动物 的 神经 系统 是 怎样 使 
用 它 的 微观 组 件 及 其 相互 作用 来 表征 和 处 理 信 息 的 。 具 体 的 做 法 
是 : 把 神经 科学 对 脑 结 构 和 机 能 从 整体 .细胞 和 分 子 水 平 上 进行 的 
生物 学 研究 作出 数学 概括 、 找 出 规律 和 算法 ,并 运用 现代 数字 计算 机 
或 人 工 神经 网 络 加 以 模拟 ;其 最 终 目 标 是 : 揭露 脑 的 电信 号 和 化 学 
信号 ,寻求 如 何 表达 和 处 理 神经 信息 、 并 在 智能 活动 中 发 生变 化 的 规 
律 。 这 种 脑 模拟 研究 通常 使 用 简化 的 脑 模型 。 因 为 ,即使 是 最 成 功 
的 生物 脑 模型 也 不 能 揭示 脑 组 织 的 全 部 实际 功能 ;所 以 ,计算 神经 科 
学 需要 抓 住 重 要 的 原理 进行 简化 模拟 。 简 化 模型 的 研究 必须 提供 建 
立 模型 的 理论 框架 ,算法 及 其 约束 条 件 , 而 这 种 简化 模型 中 的 算法 及 
其 约束 条 件 往 往 可 以 通过 现代 数字 计算 机 或 神经 计算 机 来 加 以 实 


@ 这 种 表述 方式 ,笔者 最 早 是 1992 年 左右 从 黄 昌 宁 老师 那儿 听 来 的 。 
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现 。 可 见 , 计 算 神经 科学 并 不 意味 着 大 量 的 计算 ,也 不 意味 着 一 定 要 
使 用 现代 计算 机 ,而 是 要 对 大 脑 的 认 知 过 程 进行 表征 ,把 其 信息 加 工 
过 程 和 信息 存储 过 程 跟 计算 机 进行 类 比 , 从 中 得 到 新 的 概念 和 数学 
表达 。 比 如 ,Hopfield 模型 的 建立 并 没有 借助 计算 机 进行 大 量 的 数 
值 计 算 ,但 是 这 种 模型 有 助 于 对 大 脑 获取 信息 ( 即 学 习 ) 和 提取 信息 
( 即 记忆 ?过程 的 理解 ;因此 ,这 种 数学 模拟 仍 是 计算 神经 科学 的 一 个 
组 成 部 分 。 同 样 ,我 们 认为 ,计算 语言 学 并 不 意味 着 大 量 的 计算 ,也 
不 意味 着 一 定 要 使 用 现代 计算 机 ,而 是 要 对 大 脑 中 的 语言 处 理 过 程 
进行 表征 ,把 语言 信息 的 加 工 、 存 储 过 程 跟 计 算 机 进行 类 比 , 从 中 得 
到 新 的 概念 和 数学 表达 ,以 形成 便于 机 器 处 理 的 语法 规则 或 语法 形 
式 体系 。 计 算 神 经 科学 致力 于 寻求 理解 智能 活动 的 神经 基础 的 新 概 
念 、 新 算法 ,并 在 把 新 算法 及 其 约束 条 件 跟 当代 各 类 计算 机 进行 类 比 
中 ,发 现 设计 智能 化 计算 机 、 智 能 化 机 器 人 和 智能 化 武器 的 新 原理 。 
并 且 , 计 算 神经 科学 提出 的 脑 模型 能 够 对 神经 系统 的 某 些 行为 作出 
可 以 验证 的 预测 ,从 而 较 早 地 预见 到 生物 脑 研究 工作 的 成 果 。 因 此 ， 
计算 神经 科学 对 大 脑 的 模拟 研究 ,不 仅 为 信息 科学 的 发 展 提供 了 坚 
实 的 神经 科学 基础 ,而 且 对 神经 科学 和 心理 科学 的 发 展 也 起 着 巨大 
的 推进 作用 .9 我 们 则 希望 ,采用 理论 计算 机 科学 的 观点 所 进行 的 
计算 语言 学 研究 ,不仅 对 信息 科学 、 神 经 科学 和 心理 科学 起 推动 作 
用 ,而 且 对 语言 科学 的 发 展 起 巨大 的 推动 作用 。 

“为 计算 机 ”(for computer) 研究 语言 , 指 为 了 计算 机 能 处 理 自 
然 语 言 而 研究 语言 , 即 以 计算 机 为 应 用 目标 来 研究 语言 。 这 包括 两 
方面 的 工作 : (1) 对 自然 语言 的 结构 和 意义 规律 进行 挖掘 ,提炼 出 
便于 形式 化 和 算法 化 的 句法 .语义 规则 ,建立 合适 的 语法 学 理论 模 
型 ,来 更 好 组 织 语言 的 名 法、 语义 规 则 ;(2) 把 语言 学 家 对 语言 的 名 
法 .语义 、 语 用 诸 平面 上 的 研究 成 果 进 行 数学 概括 ,用 某 种 形式 化 体 
系 来 组 织 和 表示 语言 的 结构 和 意义 规则 ,再 找 出 恰当 的 算法 来 描述 
句子 的 结构 分 析 或 语义 解释 的 严格 的 步骤 ,最 后 根据 算法 用 相应 的 
计算 机 语言 来 编程 实现 。 上 面 (1) 所 说 的 工作 本 应 完全 由 理论 语言 
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学 家 来 承担 ,但 是 ,由 于 理论 语言 学 关心 的 方面 不 一 定 跟 计 算 语 言 学 
一 致 ,因而 计算 语言 学 家 常常 会 发 现 : 语言 学 中 并 无 他 们 想 要 的 句 
法 .语义 规则 或 语法 理论 模型 ;于 是 ,计算 语言 学 家 只 得 亲自 动手 来 
寻找 名 法、 语义 规则 ,甚至 建构 更 适合 计算 机 的 语法 理论 模型 。 

在 为 计算 机 研究 语言 这 一 点 上 ,计算 语言 学 有 别 于 计算 化 学 和 
计算 神经 科学 。 在 计算 化 学 中 ,并 没有 为 计算 机 研究 化 学 这 种 任务 ; 
在 计算 神经 科学 中 ,也 没有 为 计算 机 研究 神经 的 结构 和 功能 这 种 任 
务 。 那 么 ,为 什么 计算 语言 学 要 特别 地 强调 为 计算 机 研究 语言 这 一 
点 呢 ? 原因 可 能 有 两 点 : (1) 语言 学 的 研究 对 象 是 自然 语言 ,语言 
学 的 研究 工具 (用 以 描写 语言 现象 .表述 语言 规律 .总结 研究 结果 ) 也 
是 自然 语言 。 也 就 是 说 ,自然 语言 既是 语言 研究 的 对 象 语言 ,也 是 语 
言 研究 的 元 语言 。 由 于 计算 机 无 法 直接 理解 自然 语言 ,因而 首先 必 
须 把 用 自然 语言 表述 的 语言 规律 形式 化 .符号 化 。(2) 语言 是 一 种 
心智 (mind) 现 象 ,是 跟 人 的 认 知 ,心理 密切 相关 的 ;为 了 证 计算 机 能 
理解 自然 语言 ,必须 以 计算 机 为 信息 加 工 模型 来 考察 人 类 语言 理解 
的 心理 过 程 , 以 便 在 计算 机 上 模拟 实现 。 

可 见 , 用 计算 机 和 为 计算 机 研究 语言 并 不 是 一 种 悖 论 , 而 是 计算 
机 语言 学 的 本 质 特征 。 说 来 也 真是 贷 有 趣味 ,现代 语言 学 的 创始 人 
索 绪 尔 (de Saussure) 告 谨 我 们 ， 语言 学 的 唯一 的 ` 真 正 的 对 象 是 就 
语言 和 为 语言 而 研究 的 语言 不 到 一 个 世纪 ,语言 学 的 分 支 学 科 
计算 语言 学 的 特色 竟 是 用 计算 机 和 为 计算 机 研究 语言 。 语 言 学 在 本 
世纪 的 深刻 变迁 ,从 中 可 以 略 见 一 斑 。 
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基于 统计 的 语言 处 理 模型 的 
有 用 性 和 局 限 性 


本 文通 过 介绍 和 评论 基于 统计 的 语言 处 理 模型 的 工作 原理 和 有 关 的 
应 用 实例 ,从 语言 学 理论 的 角度 来 说 明 统 计 模 型 的 有 用 性 和 局 限 性 。 首 
先 , 介 绍 上 世纪 中 叶 在 信息 论 影 响 下 的 对 语言 的 统计 结构 的 研究 ,特别 是 
和 状 姆 斯 基 等 对 于 有 限 状 态 语法 不 适合 于 刻画 自然 语言 的 论证 ;分 煌 有 限 
状态 语法 之 类 的 线性 语法 对 于 语言 教学 的 不 适用 性 ,还 讨论 了 概率 统计 
方法 对 于 语素 和 词语 界线 的 判定 直接 成 分 的 切 分 点 的 确定 .结构 炉 心 的 
断定 等 语法 分 析 的 不 适用 性 。 然后 ,通过 讨论 N 元 语法 模型 、 隐 马尔 科 夫 
模型 、 概 率 上 下 文 无 关 语 法 和 基于 统计 的 语音 识别 、 机 器 翻译 .词类 标注 、 
歧义 消解 ,来 展示 基于 统计 的 语言 处 理 模型 的 工作 原理 及 其 可 能 的 应 用 
领域 。 接着 ,讨论 语言 结构 的 递归 性 特点 和 语言 学 知识 的 结构 依赖 性 特 
点 ,指出 递归 灵 入 使 得 统计 规律 被 任意 数目 的 谈 入 词语 打 乱 ,语言 学 知识 
的 结构 依赖 性 使 得 统计 模型 奈 以 实现 的 独立 性 假设 失效 。 最 后 ,指出 处 
理 语 言 这 种 混杂 系统 ,必须 走 规则 与 统计 相 结合 的 道路 。 


1 引言 : 统计 方法 和 规则 方法 的 优 劣 之 辩 


黄 昌 宁 (2002) 指 出 , 像 语 音 识别 .词性 标注 等 中 文 信息 处 理 的 条 
需 课 题 ,并 不 一 定 要 在 汉语 理解 的 基础 上 推进 ;而 是 可 以 顺应 火 工 智 
能 学 界 在 方法 论 上 从 理性 主义 向 经 验 主 义 转变 的 历史 潮流 ,在 传统 
的 基于 语言 学 和 人 工 智能 方法 的 自然 语言 处 理 技术 以 外 ,大 胆 地 启 
用 基于 语料库 和 统计 语言 模型 的 新 方法 ,以 满足 从 小 规模 受 限 语言 
处 理 走 向 大 规模 真实 文本 处 理 这 种 实际 应 用 的 需要 。 文 章 发 表 之 
后 ,在 语言 学 界 引 起 了 强烈 的 反响 ;许多 学 者 纷纷 质疑 : 语言 学 家 总 
结 出 的 各 种 语言 学 规则 ,对 于 语言 信息 处 理 还 有 没有 用 处 ? 单纯 依 
靠 概率 统计 的 方法 ,能 否 完成 中 文 信息 处 理 任务 ? 或 者 问 得 更 深入 
一 点 : 能 和 否 从 经 过 标注 的 语料库 中 、 通 过 概率 统计 的 办 法 ,来 获得 真 
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正 的 语言 知识 ?可 谓 议论 蜂 起 ,莫衷一是 。 

其 实 , 黄 老师 在 文章 中 明确 指出 :“ 尽 管 大 规模 真实 文本 处 理 
是 一 个 战略 目标 ,不 等 于 说 小 规模 受 限 语言 处 理 , 如 受 限 领 域 的 机 
器 翻译 .语音 对 话 系统 .电话 翻译 系统 和 其 他 各 种 基于 深层 理解 的 
自然 语言 分 析 和 理论 研究 ,就 不 应 当 搞 了 。 目 标 和 任务 的 多 样 化 
也 是 学 术 ( 界 ) 繁 荣昌 盛 的 一 个 标志 。”( 第 78 页 ) 只 是 由 于 黄 老师 
在 文章 中 主要 提倡 用 基于 统计 的 语言 模型 来 研究 一 些 紧 迫 的 大 规 
模 真 实 文本 处 理 课 题 , 并 通过 词性 标注 方面 的 评测 结果 来 说 明基 
于 统计 的 方法 比 基 于 规则 的 方法 优越 ,因而 给 人 一 种 错觉 : 基于 
规则 的 语言 处 理 模 型 在 所 有 方面 都 不 如 基于 统计 的 语言 处 理 模 
型 。 显 然 , 这 不 是 黄 老 师 的 文章 的 本 意 ,可 能 也 是 黄 老师 写作 那 篇 
文章 时 始 料 未 及 的 。 

当然 ,本 文 不 只 是 想 纠正 这 种 错觉 ,而 是 要 说 明 : 从 理论 上 讲 ， 
语言 具有 递归 性 Crecursion) 的 结构 特点 ;并 且 , 语 言 知 识 具有 结构 依 
赖 的 (structure-dependent) 特 点 。 这 两 点 使 得 任何 统计 方法 都 难以 
真正 控 掘 出 系统 的 语言 知识 ,于 是 ,基于 统计 的 语言 处 理 模型 只 能 在 
某 些 非 结 梅 化 的 语言 领域 奏效 。 下 面 , 我 们 尝试 从 语言 学 理论 和 有 
关 统 计 方 法 的 具体 实践 两 个 方面 ,作出 论证 。 


2 语言 的 统计 结构 和 有 限 状 态 语法 


2.1 信息 论 和 语言 的 统计 结构 


建立 基于 统计 的 语法 模型 的 思想 ,最早 源 于 信息 论 (information 
theory) 。 大 家 知道 ,第 二 次 世界 大 战 爆发 后 由 于 破译 密码 等 紧迫 
的 军事 需要 ,有 关 国 家 投入 大 量 的 人 力 进 行 信息 编码 和 统计 的 研究 。 
这 直接 促成 了 信息 论 的 诞生 。 信息 论 根 据 信 息 (information)、 不 确 
定性 Cindeterminacy) 和 鲜 余 率 (redundancy) 等 概念 ， 提出 了 有 效 的 
通信 communication ) 管道 (channel) 的 测量 方法 。Shannon 以 
Weaver (1949: 117) 在 他 们 对 信息 论 的 开创 性 研究 中 ,指出 这 种 理 
论 对 于 语言 学 研究 可 能 具有 的 意义 : 
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诚 如 我 们 所 知道 的 ,这 种 跟 来 源 (source) 相 联系 的 信息 的 
概念 ,会 直接 促成 对 语言 的 统计 结构 (statistical structure of 
language) 的 研究 。 拿 英语 来 说 ,信息 似乎 对 于 研究 语言 和 交际 
的 每 一 方面 的 学 者 ,必定 都 是 重要 的 。 看 起 来 ,使 用 涉及 马 尔 科 
夫 过 程 这 种 强 有 力 的 理论 的 观念 ,对 于 语义 学 研究 尤其 有 前 途 ; 
因为 这 种 理论 特别 适合 于 处 理 意义 的 最 重要 、 但 也 是 最 困难 的 
的 方面 , 即 语 境 的 影响 。 人 们 有 一 种 模糊 的 感觉 ; 信息 和 意义 
也 许可 以 证 明 为 是 一 种 跟 量 子 理论 中 的 一 对 标准 的 共 斩 变 量 一 
样 的 东西 ,它们 具有 这 样 的 共同 参与 的 限制 : 当 人 们 专注 于 其 
中 的 一 个 时 ,就 得 牺牲 掉 另 一 个 。 


对 于 Shannon 和 Weaver 的 提议 ,许多 语言 学 家 作出 了 热烈 的 
响应 。 其 中 ,反应 最 热烈 的 要 数 后 布 龙 非 尔 德 学 派 (PostBlooia 
fieldian) 的 领军 人 物 Charles C，Hockett。，Hockett (1953) 对 信息 
论 作 了 具体 的 介绍 和 评论 ,并 指出 了 信息 论 在 语言 学 以 及 其 他 方面 
的 可 能 应 用 ;讨论 了 音 位 化 (phonemicization) 和 信和 号 单位 的 最 天 平 
均 箭 (maximum average entropy per single-unit) 问题 (p. 81) 、 音 位 
系统 的 统计 结构 和 总 体 问 题 (p， 86) .语素 - 音 位 的 转换 和 概率 问题 
(p. 87) ,特别 讨论 了 怎样 利用 语素 序列 的 统计 特点 来 判断 直接 成 分 
的 界限 (p. 88) 。Hockett (1955) 把 信息 论 的 成 果 应 用 到 关于 人 类 语 
言 的 马尔 科 夫 过 程 模型 (Markov-process model) 的 构造 中 。 他 运用 
通信 理论 的 概念 和 术语 ,把 Bloomfield (1935) 中 Jil 和 Jaek 的 Sr 
s 一 及 语言 交际 模式 作 了 重新 分 析 ; 指出 语音 单元 可 以 看 作 纯 
粹 由 信 源 (information source) 发 出 的 离散 的 信号 流 , 其 数学 性 质 可 
以 用 Shannon 发 展 的 技术 .通过 基于 对 信 源 发 出 的 信号 流 的 统计 数 
据 来 刻画 。 他 用 状态 (states) 和 转移 概率 ( transition-probabilities) 
组 成 的 矩阵 表 来 说 明 语 句 的 统计 结构 ,还 引入 业 来 度量 每 一 种 状态 
的 不 确定 性 。 这 种 以 马尔 科 夫 过 程 模型 为 基础 的 语法 模型 就 是 下 一 
节 将 要 讨论 的 有 限 状 态 语 法 (finite state grammar) 。 这 种 语法 的 机 
制 (device) 跟 通信 理论 家 (communication theorists) 所 主张 的 类 型 
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十 分 相似 ,而 对 Hockett (1955) 来 说 则 是 完全 一 致 。9 他 相信 ,如 果 
统计 英语 中 所 有 语素 和 许多 语素 序列 实际 出 现 的 相对 频率 ,进行 适 
当 的 计算 ;那么 ,整个 语法 结构 就 能 用 上 述 概率 转移 矩阵 的 方式 刻画 
出 来 。 当 然 ,作为 一 个 对 语言 事实 有 人 敏锐 洞察 力 的 语言 学 家 ,他 认识 
到 自然 语言 并 不 完全 适合 用 有 限 状 态 马 尔 科 夫 过 程 模型 来 刻画 ; 因 
为 ，(i) 有 限 状 态 马尔 科 夫 过 程 中 的 状态 数目 是 不 随时 间 而 改变 的 ， 
但 人 类 可 以 不 断 地 学 习 新 的 语素 .语言 系统 并 不 是 静态 的 (static) 
《ii 转移 概率 是 不 随时 间 而 改变 的 ,这 跟 语言 事实 相反 ; (ii) 任何 状 
态 可 能 再 次 出 现 ,这 意味 着 某 一 语素 序列 的 出 现 与 否 ,并 不 改变 共 时 
的 语言 系统 ;但 是 ,这 是 错误 的 ,特别 对 于 语言 的 历史 研究 来 说 。 他 
甚至 假设 ; 通过 收集 状态 转移 概率 数据 进行 计算 , 藉 此 用 概率 转移 
矩阵 来 描写 英语 的 结构 类 型 ;然后 ,把 它 交 给 工程 师 , 由 他 们 来 制造 
能 够 理解 英语 的 机 器 (p. 3 一 14) 。 这 种 让 机 器 来 理解 自然 语言 的 思 
想 ,在 当时 是 极为 前 卫 的 ;要 知道 ,人 工 智能 和 认 知 科学 的 概念 和 名 
称 是 1956 年 才 正 式 确 立 的 。Hockett (1955) 还 用 信息 论 上 的 频率 、 
业 等 概念 作为 度量 音 位 的 功能 负荷 (functional load) 的 数学 工具 ,给 
出 了 一 系列 计算 公式 ,其 直观 的 含义 是 : 一 个 特定 对 立 (contrast) 的 
功能 负荷 是 ,如 果 它 被 废除 那么 它 将 失去 的 箭 跟 没有 发 生变 化 的 系 
统 的 箭 之 比 , 所 有 对 立 的 功能 负荷 的 总 和 是 整个 系统 的 。 也 就 是 
说 ,他 用 如 果 某 个 对 立 失去 后 它 可 能 对 系统 带 来 的 后 果 , 来 衡量 这 个 
对 立 的 功能 负荷 (p. 215 一 8) 。 

可 见 ,用 统计 方法 来 研究 自然 语言 的 思想 ,在 描写 语言 学 中 已 经 
萌发 。 下 面 ,为 了 讨论 的 方便 ,我 们 先 简要 地 解释 马尔 科 夫 模型 和 形 
式 语法 的 层级 体系 两 个 概念 。 


2.2 马尔 科 夫 模型 和 形式 语法 的 层级 体系 


马尔 科 夫 模型 描述 下 列 这 类 重要 的 随机 过 程 : 如 果 一 个 系统 有 
N 个 状态 Si，S,，…，Sw, 随 着 时 间 的 推移 ,该 系统 从 某 一 状态 转移 
到 另 一 状态 。 我 们 将 在 时 间 :的 状态 记 为 q,。 对 该 系统 的 描述 通常 


四 “参考 Newmeyer (1986)，p. 2，22 ,中 译本 第 2、27 页 。 
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需要 给 出 系统 的 当前 状态 (时 间 为 ; 的 状态 ) 及 其 之 前 的 所 有 状态 ， 
系统 在 时 间 的 状态 处 于 状态 S; 的 概率 取决 于 其 在 时 间 1，2，，…， 
站 的 状态 ,该 概率 为 : 肥 《和 册 二 交 9 下 二 人 和) 如 果 
在 特定 的 情况 下 ,系统 在 时 间 : 的 状态 只 跟 其 在 时 间 : 一 1 的 状态 相 
关 , 那 么 该 系统 构成 一 个 离散 的 一 阶 马 尔 科 夫 链 (Markov chain) ， 
P(d 一 S|19- 一 S 9q 一 S 0) 一 Pd 一 So 一 S) 
〈 革 和 队 
进一步 ,如 果 只 考虑 公式 (1. 1) 独 立 于 时 间 :的 随机 过 程 ， 
P(a 一 Si|19 一 S) 一 om， 1si7 三 N ( 开 抛 
该 随机 过 程 为 马尔 科 夫 模型 。 其 中 ,状态 转移 概率 ww 大 于 或 等 于 0， 
并 且 六 个 状态 之 间 的 转移 概率 之 和 为 1。 马尔 科 夫 模型 可 以 看 作 随 
机 有 限 状态 自动 机 (automatay) ,其 中 每 一 个 状态 转换 都 有 一 个 相应 
的 概率 ,用 以 表示 自动 机 采用 这 一 状态 转换 的 可 能 性 .0 
直观 地 说 ,形式 语言 是 用 来 精确 地 描述 语言 及 其 结构 的 形式 化 
手段 , 它 以 ~>8 这 种 重 写 规则 (rewriting rule) 的 形式 来 表示 字符 串 
Cstring) 的 生成 。 如 果 指 定 一 个 初始 符号 (initial symbol) , 某 规 则 以 
其 为 左 部 ,一 组 规则 就 可 以 构成 一 个 语法 。 由 一 个 语法 生成 的 所 有 
字符 串 便 是 语言 。Chomsky (1956) 根 据 重 写 规则 的 表达 能 力 ,区 分 
了 有 限 状态 语法 .短语 结构 语法 (phrase structure grammar) 和 转换 
语法 (transformational grammar) 三 种 语言 描写 模式 。 在 此 基础 上 ， 
理论 计算 机 科学 家 根据 对 产生 式 C(production) 附 加 的 限制 条 件 的 不 
同 ,定义 了 四 类 语法 : 正则 语法 (regular.grammar) SET 文 无 关 语 法 
《contextrfree grammar)、 上 下 文 有 关 语 法 (contextrsensitive grarmmn- 
mar) 和 无 限制 重 写 系统 Cunrestricted rewriting system ) ; 并 把 这 四 
种 结构 表达 能 力 不 同 的 语法 , 称 为 “ 乔 姆 斯 基层 级 体系 ”(Chomsky 
hierarchy) 。 相 应 地 ,由 这 些 语 法 生成 的 语言 是 : 正则 语言 .上 下 文 
无 关 语言 、 上 下 文 有 关 语 言 和 递归 可 枚 举 语言 。 严格 地 说 ,形式 语法 
是 一 个 四 元 组 G= CN,，V，P,，S) ,其 中 N 是 非 终端 符号 Cnon-terminal 
symbol) 的 有 限 集 合 ,V 是 终端 符号 (terminal symbol) 的 有 限 集合 ， 


@ 详 见 翁 富 良 、. 王 野 闻 (1998) ,第 122 一 124 页 。 
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PP 是 一 组 重 写 规则 的 有 限 集合 ,而 S 是 一 个 特定 的 初始 符号 ; 
卫 一 {a-~ 有 8) 。 

a。 如 果 P 中 的 规则 满足 如 下 的 形式 : ABz, 或 AZz; 其 中 ， 
A, 也是 非 终端 符号 , 工 是 终端 符号 ;那么 称 G 为 正则 语法 (regular 
gramtmar)， 即 有 限 状 态 语 法 (简称 FSG) 。 

b. 如 果 忆 中 的 规则 满足 如 下 的 形式 : A -ao; 其 中 ,A 是非 终端 
符号 ,x 是 由 N 和 中 字符 所 组 成 的 字符 串 ( 可 以 表示 为 cE CNU 
V)* , 星 号 表示 它 右 边 的 字符 可 以 重复 0 到 任意 多 次 ); 那 么 称 G 为 
上 下 文 无 关 语法 (简称 CFG) 。 

c .如果 P 中 的 规则 满足 如 下 的 形式 : wAp-~>a7p8; 其 中 ,A 是 非 
终端 符号 ya,y,B8 是 字符 串 , 且 7 中 至 少 包含 一 个 字符 ;那么 称 G 为 
上 下 文 有 关 语 法 (简称 CSG ) 。 

d 如 果 了 中 的 规则 满足 如 下 的 形式 : wp; 其中,a,B 是 字符 
绅 ,并且 对 产生 式 >8 不 附加 任何 条 件 ; 那 么 称 G 为 无 限制 重 写 系 
统 ( 简 称 URS) 。 

给 定 一 部 语法 ,其 相应 的 语言 定义 为 所 有 合法 终端 字符 串 的 集 
合 。 合 法 终端 字符 串 指 由 初始 符号 S 出 发 ,运用 重 写 规则 而 派生 得 
到 的 终端 字符 串 。 用 以 规则 形式 表示 的 语法 来 定义 语言 的 好 处 是 简 
单 明 了 各 成 分 之 间 的 关系 清楚 。 但 是 ,不 易 判 定 一 个 字符 串 是 否 属 
于 这 套 规 则 所 规定 的 语言 。 这 时 ,通常 要 借助 自动 机 来 做 这 种 识别 
(Crecognition) 工 作 。 因为 自动 机 可 以 用 来 机 械 地 刻画 对 输入 字符 串 
的 处 理 过 程 ,只 要 根据 转移 函数 所 规定 的 状态 和 动作 进行 操作 : 如 
果 达 到 终止 状态 ,那么 认为 该 字符 串 属于 此 语言 。 自 动机 可 以 根据 
其 识别 能 力 ( 源 于 其 能 够 使 用 的 信息 存储 空间 ) 分 为 四 类 : 有 限 状态 
自动 机 (finite state automata, 简称 FSA)、 下 推 自动 机 Cpush-dowa 
automata, 简 称 PDA) 、 线 性 界限 自动 机 (linear bounded automata， 
简称 LBA) 和 图 灵机 (CTuring machine, 简称 MD) 。 它们 的 识别 能 力 
依次 递增 ,分 别 对 等 于 上 文 提 到 的 四 类 语法 .9 


四 详 见 公 富 良 、 王 野 户 (1998) ,第 34 一 45 页 ?更 具体 的 讨论 ,请 看 张 立 昂 (1996) 。 
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2.3 有 限 状 态 语 法 和 有 限 状 态 语言 


- 具体 地 说 ,有 限 状态 语法 (正则 语法 ) 是 一 种 线性 语法 (linear 
grammar) ,分 为 左 线性 语法 (left-linear grammar) 和 右 线 性 语法 
(right-linear grammar) 两 种 。 在 左 线性 语法 中 ,在 重 写 规 则 的 右 侧 ， 
单独 的 非 终端 符号 只 能 位 于 单独 的 终端 符号 的 左 侧 ; 在 右 线性 语法 
中 , 则 正好 相反 。 对 于 一 部 正则 语法 ,我 们 总 能 用 信息 论 所 建议 的 有 
限 状 态 转移 图 (finite state transition diagram) 来 表示 。 比 如 : 


ee 


图 上 每 个 带 标记 的 节点 对 应 于 一 个 非 终端 符号 ,最 右 侧 的 一 个 特殊 
的 节点 叫 终端 节点 ,用 带 斜 线 的 圆 表示 。 每 一 个 节点 对 应 于 生成 中 
的 一 个 状态 。 为 了 生成 被 正则 语法 所 定义 的 语言 中 的 一 个 句子 ,只 
需 在 跟 它 对 应 的 有 限 状 态 转移 图 上 ,从 起 始点 开始 , 沿 着 任何 一 条 弧 
从 当前 节点 转移 到 下 一 个 新 节点 ,并 记 下 该 弧 上 标注 的 符号 。 当 到 
达 最 后 节点 时 ,我 们 所 记 下 的 符号 串 就 是 这 种 语言 的 一 个 句子 。 换 
句 话说 ,在 状态 转移 图 上 每 一 条 从 起 始点 到 最 后 节点 的 路 径 都 对 应 
于 被 这 部 语法 所 生成 的 语言 中 的 一 个 句子 。 比 如 ,只 能 生成 The 
man comes. 和 The men come. 这 两 句 话 的 语法 可 以 用 下 列 状 态 图 
来 表示 : 
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我 们 可 以 给 这 部 语法 增加 若干 封闭 圈 (closed loops) 加 以 扩展 ,就 可 
以 生成 无 限 数 的 句子 。 这 样 ,除了 上 列 句 子 外 ,还 包含 下 列 句子 : 


(1) a。The old man comes. 
b.The old old man comes. 
(2) a。The old men come. 


b。The old old men come. 


包含 这 些 句 子 的 局 部 的 英语 有 限 状 态 语法 ,可 以 用 下 列 状态 图 
来 表示 : 


可 见 , 从 一 个 状态 到 另 一 个 状态 ,允许 有 几 条 不 同 的 途径 ;也 可 以 随 
便 加 多 少 个 封闭 圈 ,并且 封闭 圈 的 长 度 不 限 。 这 种 生成 语言 的 机 制 
在 数学 上 叫做 “有 限 状 态 马 尔 科 夫 过 程 ”(finite state Markov 
process) 。 为 了 完成 这 个 根据 初级 的 通信 理论 编制 的 语言 模式 ,我 
们 可 以 给 每 一 个 状态 转移 加 上 一 个 概率 ,这 样 就 可 以 计算 每 一 个 状 
态 所 带 的 “不 确定 性 ”Cuncertainty); 再 用 这 个 不 确定 性 的 平均 数 跟 
相连 的 各 个 状态 的 概率 加 权 , 就 可 以 得 到 语言 的 “信息 内 容 ”(infor- 
mation content) 。 于 是 ,通过 这 种 概括 就 可 以 来 研究 语言 的 统计 结 
构 。 显 然 “有限 状态 ” 指 的 是 状态 转移 图 中 的 状态 (节点 ) 数 量 是 有 
限 的 。 当 我 们 处 于 一 个 句子 的 生成 过 程 中 ,从 开始 状态 那里 起 头 , 说 
出 句子 的 第 一 个 词 ;接着 就 转 人 第 二 个 状态 ,这 一 状态 限制 了 第 二 个 
词 的 选择 ,等 等 。 所 经 过 的 每 一 个 状态 都 代表 了 和 若干 语法 上 的 限制 
条 件 ,这 些 条 件 在 整个 话语 的 每 一 个 状态 (节点 ) 上 都 限制 了 下 一 个 
词 的 选择 。 也 就 是 说 ,为 了 正确 地 结束 这 个 句子 ( 即 到 达 终 端 节 点 )， 
需要 知道 的 唯一 的 信息 就 是 当前 状态 (节点 ), 而 无 需 了 解 已 经 生成 
的 那 部 分 句子 的 其 他 任何 情况 。 这 就 是 Hockett (1955) 发 展 的 那 种 
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模式 。 

作为 一 种 形式 化 体系 (formalism) ,这 种 语法 利用 有 限 状 态 网 
络 , 来 为 生成 和 分 析 语 言 提 供 简单 的 机 制 。 但 是 , 它 不 能 生成 许多 特 
殊 而 有 趣 的 语言 。 一 个 简单 的 例子 是 ,字母 “x? 两 边 围 以 任意 数目 
的 成 对 括号 : 


〈3) x，(Cx)，(Cx))，((CCx)))，(((CCx))))，… 


为 了 生成 这 种 语言 的 一 个 句子 , 当 生 成 到 “x? 时 ,我 们 必须 知道 
前 面 已 经 生成 了 多 少 个 左 括号 “(”, 以 便 能 生成 同样 数量 的 右 括号 
“)”。 因 此 ,这 种 语言 无 法 由 正则 语法 来 生成 .9 


2.4 自然 语言 不 是 有 限 状 态 语 言 


乔 姆 斯 基 在 五 十 年 代 中 后 期 的 一 系列 研究 ,宣告 了 有 限 状 态 语 
法 对 于 描写 人 类 语言 不 适用 。Chomsky (1956,1957) 证 明 ,没有 一 
个 有 限 状 态 语法 能 生成 一 种 具有 下 列 情况 的 语言 : 包含 无 限 组 带 有 
骨 套 依存 Cnested dependencies) 的 语 符 列 (Cstring) ,但 又 同时 排斥 无 
限 组 跟 这 些 艇 套 依存 相 了 矛盾 的 语 符 列 ;在 英语 中 ,也 有 类 似 上 面 这 种 
衣 套 结构 。 假 如 Si ，S: ，Ss ，… 为 英语 的 陈述 句 ,那么 就 可 以 有 这 样 
一 些 英语 句子 ， 

(da IfS ythen sy. 
b.，Either S:, ，or S， . 


c， The man who said that Si ，is arriving today. 


其 中 ,(la) 中 的 then 不 能 用 or 来 代替 ,(lb) 中 的 or 不 能 用 
then 来 代替 ,(1lc) 中 的 is 不 能 用 are 来 代替 。 显 然 , 各 名 逗号 两 边 的 
词 之 间 , 都 有 相互 依存 的 关系 ( 即 ithen，eitheror，man-is)， 但 
是 ,在 每 句 相 互 依存 的 词 之 间 ,都 可 以 能 入 一 个 陈述 句 Si 9 Ss， S5 
并 且 , 这 个 陈述 句 实际 上 可 以 是 (larc) 中 的 某 一 句 。 如 果 把 (1b) 代 
替 (1lc) 中 的 Si ,将 得 到 : 


@ 本 节 内 容 详 见 Chomsky (1957), p. 18 一 25, 中 译本 第 12 一 19 页 ; Newmeyer 
(1986) ，p. 22 一 26 ,中 译本 第 26 一 32 页 ; 石 纯 一 等 (1993) ,第 341 一 343 页 。 
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(1) c?. The man who said that either Ss or Si ，is arriVing 


today。 
把 (lc7) 代 替 (C1a) 中 的 S ,将 得 到 


(1) a7. If the man who said that either Si or Su is arriving 


today， then S:. 


因此 ,一 部 用 来 生成 英语 句子 的 程序 必须 记 住 , 当 它 经 过 S; 时 前 面 
曾经 生成 过 什么 样 的 构造 ,以 便 为 了 跟 either 匹配 而 生成 or 为 了 跟 
计 匹 配 而 生成 then。 这 个 问题 跟 要 生成 成 对 的 括号 表达 式 类 似 。 这 
样 一 类 构造 说 明 ,一 个 有 限 状态 转移 网 络 (正则 语法 ), 就 像 不 适宜 用 
来 描写 括号 表达 式 一 样 , 也 不 适宜 用 来 描写 英语 这 样 的 自然 语言 。 
因为 ,说 到 底 , 像 英语 这 样 的 自然 语言 不 是 一 种 有 限 状 态 语 言 , 其 中 
包含 着 有 限 状 态 语法 无 法 处 理 的 入 套 依 存 结构 。 比 如 , Chomsky 
and Miller (1963: 286) 举 了 这 样 一 个 例子 : 


(2) Anyonel who feels that ifz so-manys moret Studentss 
whom wes havenyte actually admitted arei sitting in on the 
course thany，ones we have thats the room had to be changed， 
theny probably auditors will have to be excluded，isi likely to 
agree that the curriculum needs revision. (任何 人 ,{ 他 感到 : 如 
果 有 这 么 多 的 未 经 许可 的 [ 比 得 到 许可 的 学 生 多 得 多 的 ] 学 生 坐 
在 教室 中 听课 、 以 至 于 那个 教室 必须 更 换 , 那 么 也 许 旁 听 生 必须 
被 拒 之 门 外 ,} 可 能 都 会 同意 这 门 课程 需要 修改 。) 


其 中 ,相同 的 下 标 数 字 表 示 这 两 个 成 分 之 间 的 依存 关系 。 一 个 说 
英语 的 人 能 够 产生 并 理解 这 种 句子 ,说 明 根 据 马尔 科 夫 过 程 之 类 
的 模式 建立 起 来 的 语言 结构 理论 是 不 能 说 明 人 类 的 这 种 语言 能 力 
的 .om 


四 详 见 Chomsky (1957),， p. 18 一 25, 中 译本 第 12 一 19 页 ; Newmeyer (1986 ) ， 
p. 22 一 26, 中 译本 第 26 一 32 页 ; 石 纯 一 等 (1993) ,第 341 一 343 页 。 
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3 线性 语法 模式 和 语言 教学 


3.1 评价 语法 的 理论 标准 和 应 用 标准 


Chomsky (1964b，1965) 从 理论 的 角度 ,提出 了 语法 描写 的 充 
分 性 平面 (levels of adequacy) 学 说 。 他 认为 ,就 较 低 层面 来 说 “如 
果 语 法 正确 地 表示 了 原始 资料 ”, 那 就 达到 了 “观察 上 的 充分 性 (ob- 
servational adequacy)”; 就 较 高 层面 来 说 ,“ 当 语法 能 够 对 母语 使 用 
者 的 语言 直觉 (linguistic intuition) 作 出 合理 的 解释 ,和 (特别 是 ) 用 
这 个 语言 的 底层 规律 的 富有 意义 的 概括 来 指明 观察 到 的 资料 的 时 
候 ”, 那 就 达到 了 “描写 上 的 充分 性 (descriptive adequacy)”。 至 于 
“解释 上 的 充分 性 (Cexplanatory adequacy)” 是 语法 理论 本 身 要 达到 
的 一 个 层面 ,而 不 是 通过 理论 中 一 个 特定 的 描述 来 完成 的 。 如 果 一 
个 理论 能 够 在 具备 良好 的 动因 且 具 有 人 类 语言 官能 根据 的 一 个 关于 
语言 普遍 现象 的 理论 的 基础 上 ,从 互相 竞争 的 一 组 在 描写 上 充分 的 
语法 中 来 选择 一 个 ,那么 这 个 理论 就 被 认为 具有 “解释 上 的 充分 
性 ”. 吕 。 

上 面 这 些 标准 是 从 语法 理论 或 理论 语法 的 角度 说 的 。 但 是 ,对 
于 语言 教学 等 实际 的 应 用 目标 来 说 ,可 以 用 观察 的 完备 性 (observa- 
tional adequacy) 描写 的 完备 性 (descriptive adequacy) 和 描写 的 简 
洁 性 作为 衡量 一 个 语法 模式 优 劣 的 标准 。 具 体 地 说 ,观察 的 完备 性 
用 以 检验 语法 描写 中 所 作 的 陈述 和 观察 到 的 有 关 “ 事 实 ” 之 间 的 一 臻 
程度 ;描写 的 完备 性 用 以 检验 语法 描写 按 其 目标 应 予 收 罗 的 所 有 有 
关 事实 究竟 能 收 罗 到 何 种 程度 ,对 于 一 种 企图 揭示 人 类 的 语言 能 力 
的 语法 来 说 ,应 该 把 说 本 族 语 的 人 对 这 种 语言 的 结构 所 “了 解 2 的 一 


@ 详 见 Chomsky (1964a) ，p. 28; Chomsky (1964b)，Pp. 924; Chomsky (1965) 
p. 24 一 27, 中 译本 第 23 一 26 页 。 参 考 Newmeyer (1986) ，p. 73 ,中 译本 第 92 一 93 页 。 
这 里 的 adequacy, 吴 演 铭 先生 译作 ”妥当 性 ; 徐 烈 炯 先生 告诉 我 ,还 是 译作 “充分 性 ?好 。 
我 私下 认为 , 像 Corder (1979) 久 应 用 语言 学 导论 》 的 中 文 译 者 那样 ,译作 ”完备 性 ”也 不 
赖 。 
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切 都 纳入 描写 的 范围 。 描 写 的 简洁 性 用 以 检验 语法 描写 的 效能 。 比 
如 ,如 果 一 种 描写 能 用 数量 较 少 的 陈述 或 “规则 ?来 解释 同等 数量 的 
事实 ,或 者 能 用 同样 数量 的 规则 来 解释 更 多 的 事实 , 它 就 可 以 被 认为 
是 更 简洁 或 更 有 效能 。 当 然 , 这 些 不 同 的 衡量 尺度 在 一 定 程度 上 并 
不 互相 依赖 。 一 种 语法 描写 中 的 陈述 可 能 具有 观察 的 完备 性 ,但 并 
不 能 令 人 满意 地 包括 所 有 的 有 关 事实 ;或 者 ,虽然 包括 所 有 的 有 关 事 
实 , 但 表达 却 含糊 不 清 、 错 误 百 出 或 表达 方式 很 策 拙 。 理 想 的 情形 
是 ,语法 描写 精致 而 又 朴实 ;并 且 , 概 括 出 来 的 论断 有 重要 的 意义 ,可 
以 让 我 们 对 语言 是 如 何 起 作用 的 增进 了 解 。 如 果 用 这 些 标 准 来 衡量 
传统 语法 ,那么 我 们 也 许可 以 说 它们 的 观察 的 完备 性 一般”、 描 写 
的 完备 性 “良好 ”但 描写 的 简洁 性 则 “差劲 ”> .9 下 面 , 就 用 这 些 实 用 
性 标准 来 衡量 有 限 状 态 语 法 这 种 线性 的 语法 模式 。 


3.2 线性 语法 的 局 限 性 


之 所 以 称 有 限 状 态 语 法 为 线性 语法 ,是 因为 这 种 描写 模式 把 一 
种 语言 的 句子 看 成 一 串 语法 范畴 ,就 像 项 链 上 的 珠子 一 样 ;或 者 看 成 
一 连 串 “空位 >, 需 要 用 适合 于 每 个 空位 的 类 别 的 词 去 填充 。 因 此 ,这 
种 模式 有 时 也 被 称 为 “空位 和 填充 ?语法 (slotrand-filler grammar) 。 
这 种 类 型 的 描写 把 句子 的 结构 看 成 是 线性 的 ,在 这 线性 的 一 连 串 范 
畴 中 ,每 一 范畴 的 选择 要 依赖 于 紧 接 在 它 前 面 的 那 一 个 范畴 。 当 然 ， 
这 种 线性 序列 的 某 个 空位 ,在 大 多 数 情况 下 都 有 一 个 选择 范围 ,只 是 
有 的 范围 大 一 点 `\ 有 的 小 一 点 罢了 ;在 少数 情况 下 ,可 能 没有 选择 的 
余地 , 即 选择 是 唯一 的 。 例 如 : 


(1) He has {carefully/generally/not/given/to/a/…》 …， 

(2) He has { carefully/generally/not/ 关 ggiVeny/ 关 to/ 关 
a/…} taken …. 

(3) It consists (of} …， 

《4) It is bigger {than}y …. 


四 ”本 节 内 容 详 见 Corder (1979) ，p. 177 一 83; 中 译本 ,第 167 一 74 页 。 
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(5) I expect {to) …. 


从 例 (1) 可 以 发 现 , 在 Che]- 一 [has]-[ ]… 这 样 的 序列 中 ,空位 中 有 
许多 选择 的 可 能 性 ; 比如 ,方式 状语 、 频 率 状 语 、 和 否定 词 not、. 过 去 分 
词 .to、 冠 词 a 和 the, 等 等 。 从 例 (2) 可 以 发 现 , 在 Che] 一 [has]->[ ] 
一 [taken]… 这 样 的 序列 中 ,由 于 已 经 知道 了 下 一 个 将 出 现 什么 样 的 
词 ( 即 前 后 都 不 独立 ), 因 而 空位 中 选择 的 可 能 性 就 大 大 地 减少 了 。 
从 例 (3) 一 (5) 可 以 发 现 , 在 诸如 consist of 和 expect to 等 国定 词组 、 
或 形容 词 的 比较 级 之 后 的 连词 等 情形 下 ,这 种 序列 的 空位 中 只 有 一 
种 选择 的 可 能 性 。 

上 文 已 经 指出 , 乔 姆 斯 基 在 五 十 年 代 已 经 证 明 : 用 这 种 方式 来 
描写 一 种 语言 中 的 所 有 的 句子 结构 在 原则 上 是 不 可 能 的 。 除 了 这 种 
明显 的 不 完备 之 外 ,这 种 类 型 的 描写 对 于 理论 目的 和 应 用 目的 来 说 ， 
还 有 一 些 其 他 的 缺点 和 不 合适 之 处 。 首 先 , 它 显然 是 极其 策 抽 和 不 
简洁 的 .并 且 缺 乏 效能 ,表现 在 概括 只 能 达到 很 低 的 水 平 。 这 种 水 平 
的 概括 只 比 一 份 清单 (list) 略 胜 一 筹 , 是 最 不 完备 的 描写 。 这 种 描写 
不 容许 具有 不 同 程度 的 相似 或 差别 ,句子 成 分 要 么 被 看 成 完全 相同 、 
要 么 被 看 成 完全 不 同 。 例 如 


〈6) CThese]- 一 [boys] 一 [paint]…: 
(7) [This] 一 [boy] 一 [paints]… 


根据 这 种 线性 语法 模式 的 描写 方式 ,(6)(7) 这 两 个 序列 必须 看 成 是 
根本 上 有 区 别 的 。 这 样 , 它 就 把 传统 语法 认为 是 同一 范畴 的 语法 事 
实 ( 比 如 ,名 词 和 代词 的 单 复数 形式 、 同 一 动词 的 不 同 的 人 称 形式 ) 看 
成 是 彼此 毫 无 联系 ,而 且 完全 不 同 的 范畴 。 这 不 仅 是 不 简洁 的 ,而 且 
跟 说 本 族 语 的 人 的 直觉 相抵 触 。 因 此 ,这 种 语法 模式 既 缺 乏 效能 ,又 
缺乏 描写 的 完备 性 。 其 次 , 它 不 能 简洁 地 和 完备 地 处 理 传统 语法 上 
所 说 的 一 致 关系 ;具有 一 致 关系 的 范畴 虽然 并 不 前 后 紧 接 在 一 起 ,但 
是 它们 之 间 有 相互 依存 的 关系 。 例 如 : 


〈8) a. [CThe]- 一 [boy] 一 [generally]-[paints] 一 ~ … 
b. [The]->[boys]- 一 [generally]- 一 [paint] 一 … 
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[The] 一 [boy] 
(9 一 > ]1 
3 人 | 
(10) ax* [The]->[boy] 一 [generally]->Kpaint 要 -一 … 


b，x [The] 一 [boys]- 一 [generally]->Cpaints] 一 > … 


这 种 线性 的 语法 模式 无 法 对 (8) 中 的 两 个 序列 进行 概括 ,使 之 成 为 
(9) 这 类 更 具 概括 性 的 序列 。 如 果 那 样 做 的 话 ,就 等 于 也 得 承认 (10) 
中 的 两 个 序列 是 可 容许 的 , 即 符合 语法 的 。 因 为 ,这 种 语法 模式 中 的 
每 一 个 空位 上 可 能 出 现 的 形式 仅 由 其 前 面 紧 邻 的 成 分 决定 ,而 副词 
generally 后 面 出 现 paint 或 paints 都 是 可 能 的 。 于 是 ,频率 副词 可 
以 插入 到 主语 和 谓语 动词 之 间 这 样 一 条 为 每 一 个 说 本 族 语 的 人 都 
“知道 > 的 语法 规则 ,就 不 可 能 用 这 种 语法 模式 来 描写 最终, 必定 导 
致 观察 上 的 不 完备 性 。 
不 仅 如 此 ,反对 这 种 描写 模式 的 主要 原因 在 于 : 它 对 句子 成 分 
之 间 的 各 种 关系 不 加 区 分 ,都 看 成 是 相同 的 。 因 此 , 它 无 法 说 明 一 个 
句子 的 语法 是 怎样 使 我 们 得 以 解释 这 个 句子 的 。 任 何 旨 在 获得 描写 
完备 性 的 语法 ,必须 试图 将 句子 的 结构 (句子 成 分 及 其 关系 ) 跟 句子 
的 意义 联系 起 来 ,而 线性 语法 却 做 不 到 这 一 点 .9 


3.3 线性 语法 在 语言 教学 上 的 失败 


值得 注意 的 是 ,这 种 模式 曾经 以 一 种 更 概括 的 形式 ,被 用 作 编 写 
语言 教材 的 基础 。Fries (1957) 是 使 用 这 一 模式 的 最 有 名 的 例证 。 
在 这 种 描写 中 ,英语 所 谓 的 “基本 ”句子 作为 一 “ 连 串 ”的 成 分 范畴 
(“ 词 序 ” 模 式 或 “公式 ”) ,被 列举 出 来 。 比 如 ,他称 下 面 的 句 型 为 公式 
I: (我 们 对 他 的 标记 法 作 了 修改 ,以 便 印刷 ) 

CT 臣 S 和 有 天 让 (OH 一 ) 放 园林 4 


其 中 ,DS 王 限定 词 ,1 十 = 复数 名 词 , (2 十 /一 ) 一 4 一 复数 或 单数 


->[paints] 一 > … 


一 [paint] 一 … 


四 “未 节 内 容 详 见 Corder (1979) ，p. 177 一 83; 中 译本 ,第 167 一 74 页 。 查 核 原文 
p. 181 ,发 现 : 中 译本 第 172 页 上 的 图 12 与 图 13 的 次 序 弄 颠倒 了 ,图 下 的 英语 句子 的 动词 
后 漏 了 词尾 -s。 
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动词 的 过 去 式 ,4 王 副词 。 根 据 这 个 公式 ,将 生成 下 面 这 样 的 句子 : 


(2) a。 The pupils ran out. 


b.，The ships sailed away 


这 种 句 型 在 课本 以 “和 蔡 换 ” 表 (substitution table) 的 形式 出 现 , 如 
下 表 所 示 : 


这 张 特 定 的 表格 ,将 生成 34 个 合乎 语法 的 序列 。 经 过 扩展 后 , 它 还 
可 以 试图 把 一 致 关 系 中 的 从 属 关系 也 包括 进去 。 例 如 


从 教学 的 角度 反对 这 种 描写 ,其 理由 只 是 在 于 : 除了 它 在 描写 上 明 
显 的 不 完备 之 外 ,也 缺乏 概括 ;因而 意味 着 学 习 语 法 就 是 熟 记 一 大 串 
各 不 相同 的 而 又 互 不 相关 的 序列 ,再 加 上 一 大 堆 各 不 相同 的 而 又 互 
不 相关 的 范畴 。 这 样 ,任何 描写 都 必须 区 分 数量 相当 多 的 基本 语法 
范畴 ,但 不 把 诸如 动词 的 现在 和 过 去 形式 、 形 容 词 的 阳性 和 阴性 形 
式 、 名 词 的 单数 和 复数 以 及 定 冠 词 和 不 定 冠 词 ,归纳 在 一 起 作出 描 
写 , 这 必定 会 给 学 生 增 添 不 必要 的 记忆 负担 。 根 据 心 理学 等 的 研究 ， 
概括 在 学 习 中 起 相当 重要 的 作用 。 因 此 ,任何 缺乏 具有 重要 意义 的 
概括 的 描写 ,都 无 助 于 学 生发 现 这 些 概 括 ,也 不 能 指导 学 生 应 该 怎样 
解释 句子 .9 


@” 本 节 内 容 详 见 Corder (1979)，p. 177 一 83; 中 译本 ,第 167 一 74 页 。 
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4 统计 概率 方法 在 语法 分 析 上 的 失利 


4.1 用 音素 的 共 现 概率 来 断定 语素 和 词 的 界限 


从 上 面 的 讨论 可 以 看 出 ,用 基于 概率 的 线性 语法 模式 来 系统 地 
描写 一 种 语言 的 结构 ,在 原则 上 是 很 困难 的 。 但 是 ,这 并 不 意味 着 概 
率 统计 方法 在 语言 分 析 中 毫 无 用 武之 地 。 并 且 , 在 历史 上 的 确 有 不 
少 语言 学 家 尝试 用 概率 统计 等 方法 来 确定 语素 或 词 的 界限 ,乃至 用 
以 确定 语法 结构 的 层次 和 结构 关系 。 

Hockett (1953) 指 出 ,在 构成 话语 的 一 连 串 语素 中 , 某 个 语素 后 
面 可 能 出 现 什么 语素 的 不 确定 性 的 程度 ,在 理论 上 是 可 以 计算 的 。 
如 果 后 面 可 以 出 现 的 语素 的 数目 越 大 ,那么 不 确定 性 就 越 大 。 在 后 
面 可 以 出 现 的 语素 的 数目 相同 的 情况 下 ,如 果 这 些 语素 的 出 现 概 率 
接近 相同 ,那么 不 确定 性 就 大 ;如 果 这 些 语素 的 出 现 概率 相差 很 大 ， 
那么 不 确定 性 就 小 。 于 是 ,在 对 句法 结构 进行 直接 成 分 切 分 时 ,作为 
一 种 理论 上 可 能 是 最 佳 的 程序 ,语言 学 家 可 以 在 不 确定 性 最 大 的 地 
方 切 第 一 刀 。 比 如 ,在 red hats 中 ,red 后 面 出 现 什 么 成 分 的 不 确定 
性 大 于 red hat; 因为 ,red hat 后 面 只 能 出 现 -s,-ed 等 极 少 数 成 分 .0 
基于 同样 的 原理 ,可 以 通过 计算 不 同音 素 ( 或 拼音 符号 ) 后面 可 能 出 
现 的 音素 的 数量 ,来 识别 语素 或 词 的 界限 ;因为 ,一 个 语素 或 词 内 部 
各 音素 之 后 可 能 出 现 的 音素 的 数量 ,一 定 大 大 地 少 于 语素 或 词 之 后 
的 (p. 87 一 8) 。 我 们 不 妨 替 他 举 几 个 例子 ,来 讨论 一 下 这 种 设想 的 可 
行 性 如 何 。 例 如 : 


(1) two jars of shaving cream 


@ 中 Hockett (1953) 指 出 ,在 hermetically sealed 中 ,可 能 hermetic 之 后 的 不 确定 性 比 
hermetically 之 后 的 要 大 ;但 是 ,正确 切 分 的 第 一 刀 在 hermetically 之 后 (p. 88) 。 我 们 认 
为 ,作为 形容 词 hermetic 之 后 的 确 可 以 出 现 许多 成 分 ,但 是 , 它 有 另外 一 个 交替 形式 her- 
metical; 于 是 ,hermetic 之 后 出 现 -al 的 概率 是 极 高 的 ,而 hermetical 之 后 出 现 -ly 构成 副词 
的 概率 也 是 极 高 的 。 这 样 ,hermetically 内 部 各 语素 之 后 的 不 确定 性 肯定 小 于 hermeatically 
之 后 的 。 
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(2) When I was younger I enjoyed such things more. 
(3) cranberry，strawberry，Traspberry，blackberry，blue- 
berry 


(4) sister，brother，father，mother，daughter 


可 以 设想 ,在 jars 中 ,j 和 ar 共 现 的 概率 要 高 于 它们 跟 s 的 共 现 概 
率 ; 在 younger 中 ,y，ou 和 ng 共 现 的 概率 要 高 于 它们 跟 er 的 共 现 
概率 。 在 shaving 中 ,sh,，a 和 共 现 的 概率 要 高 于 它们 跟 i 和 ng 的 
共 现 概率 ;同样 ,; 和 ng 的 共 现 概率 要 高 于 它们 跟 sh，a 和 v 共 现 的 
概率 。 在 enjoyed 中 ,en, j，o 和 y 共 现 的 概率 要 高 于 它们 跟 1 和 4d 
的 共 现 概率 ;同样 ,i 和 d 的 共 现 概率 要 高 于 它们 跟 e, n, j, o 和 y 共 
现 的 概率 。 问题 是 , 像 )， ar，Ss，er，y，ou，ng，i，d， o 等 广泛 地 出 
现在 不 同 的 语素 中 ,这 使 得 对 它们 的 出 现 频率 或 共 现 概率 的 统计 会 
得 不 出 什么 有 意义 的 结论 。 并 且 , 这 种 统计 未 必 能 把 (3) 中 的 berry 
识别 为 一 个 语素 ,但 很 有 可 能 把 (4) 中 的 er 误 判 为 一 个 语素 。 因 此 ， 
好 像 没 见 有 人 真 的 按照 这 种 程序 去 确定 语素 或 词 的 界限 


4.2 用 概率 计算 来 决定 直接 成 分 的 界限 


Chatman (1955, 382) 阐述 并 发 挥 了 Hockett (1953: 87) 的 有 
关 思 想 : 通信 工程 师 已 经 告诉 我 们 ,在任 一 符号 串 中 , 接 下 来 将 要 出 
现 什么 的 不 确定 性 (indeterminacy) 的 程度 在 理论 上 是 可 以 计算 的 。 
这 种 观念 对 于 直接 成 分 Cimmediate constituent, 简称 IC) 分 析 也 许 
是 有 用 的 ,因为 在 一 段 话语 中 ,不 确定 性 最 大 的 点 牵涉 到 最 大 的 结构 
分 岔 。 于 是 ,在 直接 成 分 分 析 中 ,我 们 能 否 简单 地 说 : 后 续 环 境 的 可 
能 变化 越 大 ( 即 可 以 直接 跟 在 一 个 语素 后 面 的 可 能 的 语素 替换 类 越 
多 ) ,把 这 个 语素 跟 其 后 的 成 分 在 结构 上 分 开 的 可 能 性 越 大 。 在 这 种 
思想 的 指导 下 ,Chatman (1955) 根据 概率 论 和 信息 论 的 有 关 原 理 ， 
特别 是 符号 串 中 的 不 确定 性 原理 (the“indeterminacy in string” 
principle) ;具体 地 构造 并 实施 了 一 种 通过 概率 计算 来 确定 直接 成 分 


@ 好 像 Z. Harris 的 哪 篇 文章 中 也 曾 简略 地 提 及 这 种 方法 ,出 处 失 记 。 
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的 层次 划分 的 方法 ,简称 概率 计算 法 。 

范 继 羯 (1964/1983) 把 这 种 方法 的 要 领 总 结 为 : 考察 一 段 话 里 
的 每 一 个 语素 ,计算 它们 之 后 可 能 连接 多 少 个 不 同 的 语素 类 。 然 后 ， 
假设 可 能 连接 的 语素 类 最 多 的 地 方 ( 即 出 现 语 素 类 的 不 肯定 性 最 大 
的 地 方 ) ,就 是 结构 上 的 交接 点 ,直接 成 分 应 该 从 这 里 切 开 。 切 下 来 
的 各 个 部 分 又 根据 同一 方法 切 分 ,直到 所 有 的 语素 都 切 开 为 止 。 比 
如 ,Chatman (1955: 383 一 5) 认 为 ,对 英语 的 句子 The boy played 
near the house 划分 层次 , 先 要 进行 如 下 计算 :9 


The 之 后 可 能 出 现 名 词 \ 动词、 形容 词 以 及 ] 组 功能 词 , 共 
4 类 ; 
The boy 之 后 可 能 出 现 名 词 动词 、 形 容 词 \ 副 词 以 及 11 组 
功能 词 , 共 15 类 :; 
The boy play 之 后 可 能 出 现形 容 词 和 2 种 夭 着 形式 , 共 3 
类 ; 
The boy played 之 后 可 能 出 现 名 词 、 动 词 、 形容词、 副词 以 
及 6 组 功能 词 , 共 10 类 ; 
The boy played near 之 后 可 能 出 现 名 词 、 形容 词 、. 副 词 以 及 
4 组 功能 词 , 共 7 类 ; 
The boy played near the 之 后 可 能 出 现 的 语素 类 跟 句 首 的 
The 相同 , 共 4 类 。 
显然 ,The boy 之 后 有 15 种 可 能 ,不 确定 性 最 大 ;所 以 第 一 层次 应 该 
在 这 儿 切 开 , 其 余 类 推 。 于 是 ,全 名 的 层次 如 下 (数字 表示 不 确定 性 
的 大 小 ) : 


从 全 刘 注 中 中 人 罗 4 
Thellboylplaylledllnearllthelllhouse. 


四 Chatman (1955) 根 据 的 是 Fries (1957) 对 英语 词类 的 划分 法 , 即 把 英语 词类 分 为 
I 类 词 II 类 词 III 类 词 和 IV 类 词 四 个 大 类 ,以 及 十 五 组 功能 词 。 这 四 个 大 类 实际 上 就 是 
传统 语法 上 的 名 词 动词 ,形容词 和 副词 ,而 功能 词 则 是 传统 语法 上 的 虚词 。 为 了 便于 理 
解 , 范 继 渡 (1964/1983) 把 它们 改 为 用 传统 语法 的 名 称 来 叙述 。 现 在 ,我 们 根据 范 继 渡 
(1964/1983) 第 224 一 225 页 的 有 关 表 述 。 


基于 统计 的 语言 处 理 模型 的 有 用 性 和 局 限 性 51 


范 继 济 (1964/1983) 从 理论 上 对 这 种 概率 计算 法 进行 了 分 析 , 指 
出 : 所 谓 不 确定 性 大 就 是 能 进入 的 环境 最 多 ,实际 上 是 在 计算 整 段 
话语 中 每 一 类 语素 出 现 的 条 件 概 率 。 条 件 概 率 对 于 预期 语言 的 信息 
有 一 定 的 参考 作用 ,但 它 是 香 能 决定 语素 序列 的 层次 组 合 还 需要 证 
明 。 我 们 还 没有 看 到 说 明 这 两 者 之 间 具 有 必然 关系 的 任何 证 据 。 其 
次 ,所 谓 不 确定 性 的 大 小 既然 是 按照 语素 类 别 来 计算 ,那么 根据 不 同 
的 分 类 法 就 可 以 得 出 不 同 的 结果 。 如 果 我 们 用 传统 的 英语 八大 词类 
来 计算 , 慌 怕 上 例 的 层次 组 合 就 要 改观 。 于 是 ,语言 本 身 所 固有 的 层 
次 结构 居然 会 随 着 不 同 的 语法 体系 对 词类 的 不 同 划分 而 发 生变 化 。 
这 在 理论 上 是 讲 不 通 的 。 再 次 ,概率 计算 只 能 得 出 一 种 结果 ,不 可 能 
同时 计算 出 两 组 不 同 的 数字 。 于 是 ,年 老 的 | 男人 和 女人 一 年 老 的 
男人 | 和 | 女人 ”“ 咬 死 了 | 猎人 的 狗 一 咬 死 了 狂人 的 | 狗 ” 等 歧义 名 式 
的 层次 差别 就 无 法 揭示 出 来 。 拿 汉语 的 例子 来 检验 一 下 ,可 以 发 现 : 
它 对 同类 成 分 组 成 的 长 串 组 合 无 能 为 力 。 例 如 


(1) 北京 大 学 中 文系 语言 学 专业 研究 生 


其 中 的 各 组 成 成 分 都 是 名 词性 的 ,它们 之 后 可 能 出 现 的 语素 类 的 数 
量 相等 , 即 不 确定 性 的 大 小 一 样 , 怎 么 划分 层次 呢 ? 同样 地 ,长 串 的 
动词 组 合 也 会 碰 到 这 种 问题 。 即 使 是 由 不 同 的 形式 类 构成 的 组 合 ， 
照样 也 会 碰 到 这 种 问题 。 以 数量 名 组 合 “ 一 条 花 ”为 例 , 根 据 北京 大 
学 《现代 汉语 》 兴 1962 年 版 ) 的 词类 划分 计算 如 下 : 


“一 ”之 后 可 能 出 现 的 语素 类 : [1] 和 名词; 如 :一 人 ;[2] 代 
词 , 如 : 一 这 样 想 ,就 ……;[3] 数 词 , 如 : 一 百 ;[C4] 量词 ,如 : 一 
个 ;55] 动词 ,一 看 ;56] 形容 词 , 如 : 一 大 把 ;[7] 副词 ,如 : 一 不 
抽烟 ,二 不 喝酒 ;58] 介词 ,如 : 一 从 上 海 来 ,就 ……35C9] 连词 ， 
如 : 一 和 二 3;[103 助词 ,如 : 一 的 平方 ;511] 语气 词 ,如 : 一 呀 ， 
二 呀 …… 。 “一 鞭 ? 之 后 可 能 出 现 的 语素 类 : [1] 名 词 , 如 : 一 采 
花 ;[52] 代词 ,如 : 一 这 样 的 花 ;53] 数 词 ,如 : 一 条 五 个 花 办 ， 
[4] 量词 ,如 : 一 采 采 的 红 花 ;[5] 动词 ,一 采 开 了 ,一 条 谢 了 ; 
[6] 形容 词 , 如 : 一 采 红 的 ;[7] 副词 ,如 : 一 采 很 大 的 花 ;[8] 介 
词 , 如 : 一 乳 从 树 上 掉 下 来 的 花 ;[59] 连词 ,如 : 一 条 和 二 采 ; 
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[10] 助词 ,如 : 一 柔 的 花 办 是 红 的 ;[11] 语气 词 , 如 : 一 条 呀 ， 


“一 ”和 “一 杀 ” 之 后 可 能 出 现 的 语素 类 都 是 11 类 ,那么 应 该 在 哪里 
划分 呢 ? 还 有 一 种 情形 ,黏着 形式 总 起 来 算 一 个 ,还 是 有 一 个 算 一 
个 ? 如 果 作 为 一 类 ,那么 “我 看 书 ” 的 “我 ?和 "我 看 之 后 都 只 能 加 上 
一 类 黏着 形式 。 如 果 有 一 个 算 一 个 ,那么 “我 ?之 后 只 能 加 一 个 “ 们 ”， 
而 “我 看 之 后 可 以 加 “了 着、 过 ”三 种 黏着 形式 。 于 是 ,概率 计算 的 
结果 就 大 不 一 样 。 据 此 , 范 先生 得 出 结论 : 以 上 的 检验 证 实 了 我 们 
的 怀疑 一 一 条 件 概率 跟 层 次 组 合并 无 关系 ,概率 计算 法 只 是 一 种 主 
观 的 设想 (第 224 一 227 页 ) 。 


4.3 用 数量 统计 来 决定 结构 核心 


更 有 甚 者 ,Pittman (1948) 整理 出 十 条 标准 来 判定 在 由 两 个 直 
接 成 分 构成 的 序列 AB 中 ,到底 哪 一 个 是 结构 核心 。 其 中 ,有 四 条 用 
到 数量 统计 ,它们 分 别 是 : 


标准 2: 类 的 大 小 。 如 果 两 个 直接 成 分 ,其 中 有 一 个 成 分 所 
属 的 形式 类 比 另 一 个 成 分 所 属 的 形式 类 大 ( 即 有 较 多 成 员 的 
类 ) ,一 般 把 它 看 成 是 中 心 的 (central) ,而 把 它 的 伴随 成 分 看 成 
是 旁 侧 的 (lateral) 。 如 英语 的 副词 与 动词 \ 代 词 与 动词 ,词组 与 
词 干 。 

标准 3: 搭配 力 (范围 ) 。 如 果 两 个 直接 成 分 ,其 中 有 一 个 成 
分 比 另 一 个 成 分 有 更 多 不 同类 的 伴随 关系 的 可 能 出 现 范围 ,一 
般 把 它 看 成 是 中 心 的 ,而 把 它 的 伴随 成 分 看 成 是 旁 侧 的 。 如 英 
语 的 come downy，inside; 法 语 的 deux ans( 两 年 )。 

标准 5: 类 的 频率 。 如 果 两 个 直接 成 分 的 类 ,其 中 一 个 类 比 
另 一 个 类 出 现 的 次 数 多 ,那么 就 把 它 看 成 是 中 心 的 ,而 把 它 的 伴 
随 成 分 看 成 是 旁 侧 的 。 如 英语 的 名 词 比 形容 词 出 现 的 次 数 多 、 
动词 比 副 词 出 现 的 次 数 多 、 词 干 比 词 缓 出现 的 次 数 多 、 独 立 句 比 
从 属 名 出现 的 次 数 多 。 

标准 6: 个 体 的 频率 。 如 果 某 一 个 个 别 成 分 出 现 的 次 数 , 比 
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它 的 伴随 成 分 出 现 的 次 数 多 ;那么 就 把 它 看 成 是 和 旁 侧 的 ,而 把 它 
的 伴随 成 分 看 成 是 中 心 的。 如 像 在 Nahuatl 语 这 样 的 语言 中 ， 
由 于 词 干 一 定 要 带 上 词组 才能 出 现 , 因 而 某 些 词组 一 定 比 词 干 
类 的 任何 成 员 出 现 的 次 数 要 多 得 多 。 比 如 ,前 缓 nr 和 后 缓 -tl， 
就 比 随 它们 一 起 出 现 的 任何 一 个 词 干 的 频率 要 高 得 多 。 


显然 ,如 果 拿 汉语 的 事实 来 检验 ,那么 这 几 条 标准 都 站 不 住 。 就 
类 的 大 小 来 说 ,形容 词 的 成 员 比 动词 少 , 在 “ 形 十 动 ? 组 合 ( 偏 正 结构 ， 
如 : 认真 学 习 ) 和 ”“ 动 十 形 ? 组 合 ( 述 补 结构 ,如 : 码 放 整 齐 ) 中 ,正好 
动词 是 核心 。 形 容 词 的 成 员 比 名 词 少 ,在 “ 形 十 名 ?组合 ( 偏 正 结构 ， 
如 : 干净 衣服 ) 中 磁 巧 名 词 是 核心 ;但 是 在 “名 十 形 ? 组 合 ( 主 谓 结构 ， 
如 : 衣服 干净 ) 中 ,形容词 却 是 核心 了 。 动 词 的 成 员 比 名 词 少 ,在 “ 动 
十 名 ”组 合 ( 述 宾 结 构 , 如 : 买 汽 车 ) 和 “名 十 动 ? 组 合 ( 主 谓 结构 ,如 : 
客人 走 了 ) 中 ,动词 都 是 核心 。 就 搭配 能 力 来 说 ,形容 词 比 名 词 和 动 
词 强 。 比 如 , 它 可 以 作 名 词 和 动词 性 成 分 的 谓语 (如 : 南方 湿润 .去 
好 ), 这 时 是 核心 ; 它 可 以 修饰 名 词 和 动词 (如 : 小 房间 ,努力 工作 )、 
可 以 作 动词 的 补 语 ( 如 : 弄 明白 )、. 可 以 作 主 语 和 宾语 (诚实 好 、 嘉 欢 
安静 ) ,这 些 情 况 下 都 不 是 核心 。 就 类 的 频率 来 说 ,名 词 肯 定 高 于 动 
词 和 形容 词 ; 但 是 ,在 “名 十 动 "“ 动 十 名 ”和 "名 十 形 ” 组 合 中 ,名 词 
都 不 是 核心 ;只 有 在 “ 形 十 名 ”组合 中 ,名 词 才 是 核心 。 就 个 体 的 频率 
来 说 ,一 些 常用 名 词 肯 定 高 于 经 常 跟 它 们 搭配 的 常用 动词 和 形容 词 ; 
但 是 ,这 些 “ 名 十 动 *"“ 动 十 名 ”和 ”名 十 形 ” 组 合 ,名 词 也 不 是 核心 ; 
只 有 在 “ 形 十 名 ”组 合 中 名 词 才 是 核心 。 因 此 ,Pittman〈1948) 也 只 
得 承认 ,这 个 标准 是 有 例外 的 。…… 这 些 标 准 的 适用 程度 是 不 同 的 ， 
适用 程度 的 大 小 取决 于 有 关 的 语言 的 性 质 和 语言 学 家 掌握 这 些 标 准 
的 程度 。 尽 管 如 此 ,他 还 是 希望 它们 也 可 以 有 效 地 用 于 音素 结构 和 
音节 结构 。 而 我 们 认为 ,这 相当 困难 ,无 论 在 语法 结构 上 、 还 是 在 音 
素 结构 和 音节 结构 上 。 后 来 ,似乎 再 也 没有 人 尝试 这 样 做 ,就 是 一 个 
显而易见 的 证 明 。 
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5 基于 统计 的 语言 处 理 模型 的 工作 原理 


s.1 基于 规则 的 模型 和 基于 统计 的 模型 


基于 统计 的 语言 处 理 模型 是 相对 于 基于 规则 的 语言 处 理 模 型 
而 言 的 ,两 者 区 别 在 于 : 前 者 是 一 种 概率 性 的 非 确定 性 的 语言 处 理 
模型 ,后 者 是 一 种 确定 性 的 语言 处 理 模型 。 一 般 地 说 ,确定 性 的 模型 
运用 明确 的 规则 来 表述 物理 世界 (或 自然 语言 ) 的 已 知 的 特定 属性 。 
在 物理 学 中 ,如 牛顿 力学 ;在 自然 语言 处 理 中 ,如 正则 语法 `、 上 下 文 无 
关 语 法 等 形式 语法 。 它 们 都 属于 确定 性 的 模型 。 但 是 ,并 不 是 所 有 
的 物理 世界 和 自然 语言 的 现象 都 可 以 用 确定 性 的 规则 来 刻 划 ,而且 
这 些 规 则 的 使 用 也 具有 不 确定 性 。 在 这 种 情况 下 ,统计 模型 被 用 以 
描述 物理 世界 和 自然 语言 的 统计 属性 。 建 立 统计 模型 的 基本 假设 
是 : 物理 世界 和 自然 语言 可 以 用 随机 过 程 来 刻 划 ,而 随机 过 程 中 的 
参数 可 以 精确 地 估计 。 比 如 ,物理 学 上 的 统计 力学 .自然 语言 处 理 中 
的 概率 语法 ,都 属于 统计 模型 。@ 对 于 自然 语言 处 理 来 说 , 它 涉 及 的 
知识 是 海量 的 ,尤其 是 当 我 们 要 面 对 大 规模 真实 文本 处 理 时 ,就 能 发 
现 基 于 规则 的 方法 会 碰 到 下 列 目前 还 难以 克服 的 困难 :2 


(1) 获取 语言 学 知识 (linguistic knowledge) 以 及 相关 的 世 
界 知 识 C(world knowledge) 是 一 件 非常 困难 的 事情 ,要 想 对 它们 
进行 形式 化 表示 更 不 容易 ;更 何况 并 不 是 所 有 的 自然 语言 都 像 
英语 那样 得 到 了 比较 深入 的 研究 ,从 而 具有 比较 成 熟 的 句法 学 
和 语义 学 的 描写 体系 。 

(2) 自然 语言 中 有 大 量 的 非 单 调 (nonrmonotonous) 现 象 ， 
我 们 不 能 保证 关于 自然 语言 的 大 量 的 不 同 的 规则 之 间 一 定 是 相 
容 的 ;这 样 ,在 自然 语言 处 理 系 统 中 , 随 着 规则 数量 的 增加 ,规则 
与 规则 之 间 常 常 发 生 矛 盾 和 冲突 。 


@ 详 见 翁 富 良 、 王 野 逆 (1998) ,第 116 页 。 
四” 详 见 黄 昌 宁 (2002) ,第 79 页 ; 白 栓 虎 (1992) ,第 39 页 。 
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(3) 规则 所 能 刻画 的 知识 的 颗粒 度 太 大 ,无 法 用 有 限 的 规 
则 来 刻画 自然 语言 中 复杂 多 变 的 现象 。 
〈《4) 很 难处 理 自然 语言 中 的 不 确定 性 ,比如 ,句子 的 合 语 法 
性 和 可 接受 性 常常 是 模糊 的 , 词 和 短语 等 语法 单位 的 边界 
Cboundaries) 也 是 不 十 分 清晰 的 。 
因此 ,在 目前 的 语言 学 理论 水 平和 计算 技术 条 件 下 ,人 们 自然 地 
会 转向 统计 学 方法 ,希望 用 在 语料库 中 对 相关 数据 的 统计 的 方法 ,来 
为 要 解决 的 语言 问题 建立 统计 模型 ,并且 由 语料库 中 的 训练 数据 来 
估计 统计 模型 中 的 有 关 参 数 。 于 是 ,基于 大 规模 语料库 的 概率 统计 
模型 成 了 自然 语言 处 理 的 一 种 必然 的 选择 。 下 面 , 我 们 先 介绍 三 种 
基于 统计 的 语言 处 理 模型 的 工作 原理 ,再 介绍 四 个 统计 模型 的 应 用 
实例 。 


5.2 N 元 模型 (N-1 阶 马 尔 科 夫 模型 ) 


语言 的 统计 模型 可 用 于 计算 语句 三 三 mr，zm，……，w 的 先 验 
概率 忆 ( 允 ) ,在 这 里 用 变量 克 代表 一 个 文本 中 顺序 排列 的 ”个 词 。 
根据 概率 论 的 定理 (乘法 规则 ?), PC) 可 以 分 解 为 : 

忆 【了 厂 ) 三 ToPCaos| za ， 记 二 1 8 
其 中 ,符号 I-…*P(…) 表 示 概 率 的 连 乘 ; 如 果 把 它 展开 来 就 是 : 
PC(WD) 王 PCrl)PCrs | )PCrs | ，ros )…， 
PCr za ，rop 和 和， 1) 55 2 
可 见 , 为 了 预测 rw, 的 出 现 概 率 ,必须 知道 它 前 面 所 有 词 的 出 现 概 
率 ; 这 wm ，…zz ，zwo1 被 称 为 产生 w 的 历史 。 随 着 历史 的 长 度 的 
增加 ,不同 历 史 数 按 指数 级 增长 。 如 果 历 史 长 度 为 ;一 1, 则 有 工 王 : 
不 同 的 历史 (LI 为 词汇 集 的 大 小 ) 。 我 们 必须 考虑 在 所 有 的 工 ” 种 历 
史 的 情况 下 ,产生 第 ;个 词 的 概率 。 也 就 是 说 ,这 样 的 模型 中 有 雹 : 
个 自由 参数 Pa ，…，w)。 当 工 一 5000,i 一 3 时 ,自由 参数 


OO 乘法 规则 用 以 计算 两 件 事 一 起 发 生 的 概率 : 两 件 事 一 起 发 生 的 几率 等 于 第 一 件 
事 发 生 的 几率 乘 以 已 知 第 一 件 事 发 生 的 情况 下 第 二 件 事 发 生 的 几率 。 详 见 Freedman 等 
(1991) 的 中 译本 ,第 253 一 255 页 。 
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的 数目 是 1250 亿 。 我 们 几乎 不 可 能 从 训练 数据 中 正确 地 估计 这 些 
参数 ,并 且 绝 大 多 数 的 历史 在 训练 数据 中 根本 没有 出 现 。 解 决 这 个 
问题 的 方法 是 ,将 历史 mw ，…，w 按照 某 个 法 则 影射 到 等 价 类 S 
(wy，…，mwPi) ,而 等 价 类 的 数目 远 远 小 于 不 同 历 史 的 数目 。 有 很 
多 方法 可 以 将 历史 划分 成 等 价 类 ,比如 ,把 参数 空间 中 一 些 特 征 相 近 
的 元 素 合 并 到 一 起 得 到 一 个 个 等 价 类 ;于 是 ,参加 运算 的 是 这 些 类 ， 
而 不 再 是 单个 的 元 素 。 从 计算 上 看 ,这 样 还 是 太 复 杂 。 如 果 任 意 一 
个 词 出 现 的 概率 只 跟 它 前 面 的 N 一 1CN 辫 1) 个 词 相关 ,那么 问题 就 
可 以 得 到 进一步 的 简化 。 这 时 的 语言 模型 叫 N 元 模型 或 N 元 语法 
CN-gram) , 即 
P(W) 王 P (mi) P (rs|rm) P (rs rs) … 
四 (Crzoil rw 一 N+l 2 
Ai- 了 (rilzNri， 1) (65 3 
通常 N 的 值 不 能 太 大 ,否则 会 有 太 多 的 等 价 类 ,前 面 提 及 的 过 多 自 
由 参数 的 问题 仍然 存在 。 当 N=1 时 , 即 近似 地 认为 出 现在 第 ;位 
上 的 词 w;, 独立 于 历史 ( 它 的 出 现 概率 跟 它 前 面 的 词 无 关 ) 时 ,这 种 
N 元 语言 模型 称 为 一 元 语法 Cuni-gram, 或 mono-gram)。 当 入 三 2 
时 , 即 近似 地 认为 出 现在 第 ;位 上 的 词 w; 的 出 现 概率 只 跟 它 前 面 紧 
邻 的 一 个 词 相 关 时 ,这 种 N 元 语言 模型 称 为 二 元 语法 (birgram) 。 
当 N=3 时 , 即 近似 地 认为 出 现在 第 关 位 上 的 词 w; 的 出 现 概 率 只 跟 
它 前 面 紧 邻 的 两 个 词 相 关 时 ,这 种 N 元 语言 模型 称 为 三 元 语法 (tri- 
gram) 。 其 实 ,N 元 模型 就 是 N-1 阶 马 尔 科 夫 模型 。 因 此 ,一 元 语法 
就 是 零 阶 马尔 科 夫 链 , 二 元 语法 就 是 一 阶 马 尔 科 夫 链 , 三 元 语法 就 是 
二 阶 马尔 科 夫 链 …… 。 当 使 用 三 元 语法 模型 时 ,P (〈 丽 ) 可 以 分 解 为 : 
P (W) 之 UP (oil ，r-1) 《5.2.。4) 
该 模型 的 参数 为 P (ws | rw ，w ) ,其 值 可 以 通过 大 规模 语料库 .用 最 
大 似 然 估 计 Cmaximum 1likelihood estimation) 方 法 来 求 得 : 
Pros | rs ，i) 一 太 (rs|ros，wi) 
一 count(roly ro ys )/count(Crol yz ) 
《525 
其 中 ,count (zw ，r ，ros ) 表 示 一 个 特定 的 词 序列 rw ，rwz ，rzs 在 语 


基于 统计 的 语言 处 理 模型 的 有 用 性 和 局 限 性 57 


料 库 〈 或 训练 例 ) 中 出 现 的 次 数 ,count (wii，rw ) 表 示 一 个 特定 的 词 
序列 zw ，rws 在 语料库 (或 训练 例 ) 中 出 现 的 次 数 ,F (rs | rw ，zm ) 表 
示 在 给 定 ww ，zs 的 条 件 下 出 现 ws 的 概率 。 但 是 ,在 训练 数据 中 ， 
很 可 能 事件 rw ，ww ，rws 这 种 词 序列 根本 没有 出 现 过 ,根据 最 大 似 然 
估计 ,这 些 事件 的 概率 为 零 。 然 而 ,这 些 事件 的 真实 概率 不 一 定 为 
零 。 这 就 是 所 谓 的 数据 稀 朴 问题 (sparse data problem) 。 现 在 已 经 
发 展 出 解决 这 一 问题 的 有 关 方 法 ,此 处 从 略 。. 


S$.3 隐 马 尔 科 夫 模 型 (Hidden Markov Model ， 简 称 HMMD 


隐 马 尔 科 夫 模型 是 由 转移 链 连接 的 多 个 状态 的 集合 。 其 中 ,每 
个 转移 链 上 都 有 两 组 概率 : 转移 概率 (transition probability) 和 输出 
概率 密度 函数 (output probability density function) 。 前 者 给 出 了 执 
行 该 转移 的 概率 ,后 者 定义 了 在 执行 某 个 转移 的 条 件 下 从 有 限 字母 
表 中 输出 每 个 符号 的 概率 。 比 较 起 来 ,在 马尔 科 夫 模型 中 ,每 一 个 状 
态 代表 一 个 可 观察 事件 ;马尔 科 夫 模型 描述 的 是 一 个 随机 过 程 (sto- 
chastic process), 即 状态 之 间 的 转移 。 这 限制 了 模型 的 适用 性 。 隐 
马尔 科 夫 模型 是 马尔 科 夫 模型 的 扩展 。 在 隐 马 尔 科 夫 模 型 中 ,观察 
到 的 事件 是 状态 的 随机 函数 。 因 此 ,这 种 模型 是 一 种 双重 随机 过 程 : 
一 个 随机 过 程 描 述 输出 符号 与 状态 之 间 的 概率 关系 , 即 输出 符号 是 
状态 概率 的 函数 ; 另 一 个 随机 过 程 描述 的 才 是 状态 之 间 的 转移 关系 。 
其 中 ,对 于 外 界 的 观察 者 来 说 ,只 能 看 见 输 出 符号 ,而 不 能 看 见 状态 
之 间 的 转移 ; 即 该 模型 的 状态 转换 过 程 是 不 可 观察 的 (隐蔽 的 )。 可 
观察 事件 的 随机 过 程 是 隐蔽 的 状态 的 转换 过 程 的 随机 函数 。 这 种 模 
型 有 如 下 的 组 成 部 分 : (1) 模型 中 的 状态 数 N。(2) 从 每 一 状态 可 
能 输出 的 不 同 符号 数 M。(3) 状态 转移 概率 矩阵 A 王 cj ,其 中 

oij 一 P(q 一 Si|q 一 S),1 大 27 三 


@ 上 详 见 休 富 良 、 王 野 逆 (1998) ,第 116 一 24 页 ; 黄 昌 宁 (2002), 第 80 页 ; 白 栓 虎 
(1992) ,第 50 一 52 页 ; 黄 昌 宁 、 李 涓 子 (2002) ,第 115 一 6 页 。 必 须 指出 的 是 , 翁 富 良 . 王 野 
疹 (1998) ,第 118 页 说 :“ 当 N=1 时 ,……N-gram 语言 模型 被 称 为 一 阶 马 尔 科 夫 链 。 当 N 
一 2 时 ,N-gram 语言 模型 被 称 为 二 阶 马 尔 科 夫 链 。 当 六 =3 时 ,N-gram 语言 模型 被 称 为 
三 阶 马尔 科 夫 链 ”。 这 跟 一 般 的 理解 有 所 不 同 。 
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其 中 ,状态 转移 概率 ,大 于 或 等 于 0, 并 且 六 个 状态 之 间 的 转移 概 
率 之 和 为 1。(4) 从 状态 .S; 观察 到 符号 的 概率 分 布 矩 阵 为 也 一 
CR)。(5) 初始 状态 概率 分 布 * 一 吉 。 为 了 方便 ,可 以 把 隐 马 尔 科 
夫 模型 记 为 =(A，B,，xr) ,用 以 指出 模型 的 参数 集合 。 这 种 模型 会 
碰 到 如 何 快速 地 计算 或 调节 有 关 概 率 或 参数 .选择 最 优 的 状态 序列 
等 问题 。 现 在 已 经 发 展 出 一 些 算法 来 解决 这 些 问题 ,这 里 从 略 。9 


s.4 概率 上 下 文 无 关 语 法 (Probabilistic Context Free Gram- 
mar, 简 称 PCEFEG) 


概率 上 下 文 无 关 语法 是 上 下 文 无 关 语法 的 概率 拓 广 ,表现 为 : 
上 下 文 无 关 语法 中 的 每 一 个 产生 式 A 一 a 都 被 附加 了 一 个 概率 值 。 
对 所 有 的 非 终端 符号 A ,该 概率 分 布 必须 满足 

YY P(A->oa) 王 1 

跟 上 下 文 无 关 语法 相 比 ,概率 上 下 文 无 关 语法 有 下 列 优点 : 〈i 在 一 
个 有 此 义 的 概率 上 下 文 无 关 语法 中 ,如 果 参 数 选择 适当 ,正确 的 语法 
结构 具有 较 高 的 概率 。 因 而 PCFG 能 够 用 以 化 解 歧义 (disambigu- 
ation ,或 ambiguity resolution), 即 在 诸多 的 语法 结构 (歧义 分 析 ) 中 
选择 正确 的 语法 结构 。(iil 由 于 可 以 尽早 删除 语法 分 析 过 程 中 发 现 
的 概率 很 小 的 子 结构 (sub-structure) ,因而 PCFG 加 速 了 语法 分 析 。 
(iii) PCFG 使 我 们 能 够 定量 地 比较 两 个 语法 的 性 能 。 给 定 两 个 语法 
G 和 G， ,我 们 可 以 使 用 语料库 C 来 定量 地 评价 G, 和 Gz ;如果 Pa 
(CO) 之 Pa(C) ,那么 我 们 可 以 得 出 Gi 优 于 Gs 的 结论 。 当 然 , 跟 隐 马 
尔 科 夫 模型 一 样 ,PCFG 也 会 磁 到 如 何 快 速 地 计算 或 调节 有 关 概 率 、 
选择 最 佳 的 语法 分 析 等 问题 。 现 在 已 经 发 展 出 一 些 算法 来 解决 这 些 
问题 ,这 里 从 略 .@ 关于 这 种 语法 存在 的 问题 , $ 6. 3 将 有 简略 的 讨论 。 


5.5 ”基于 统计 的 语音 识别 
从 统计 的 角度 看 ,语音 识别 的 任务 是 , 在 给 定语 音讯 号 (speech 


四 详 见 黄 昌 宁 、 李 涓 子 (2002) ,第 116 一 118 页 ; 翁 富 良 、 王 野 (1998) ,第 124 一 136 
页 。 
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signalD)A 时 , 找 出 语句 ( 即 词语 序列 )S, 使 得 P (SI1A) 最 大 ;也 就 是 
说 ,S 最 可 能 是 A 所 传达 的 语句 。 因 此 ,语音 识别 可 视 为 计算 以 下 
条 件 概率 的 极 大 值 问题 : 

S 王 argmaazsP(S|A) 后 .. 协 
P(CS1A) 表 示 已 知 输入 语音 讯号 序列 A 的 情况 下 ,出 现 词语 序列 S 
的 条 件 概 率 。 数 学 符号 argmzazs 表示 通过 考察 不 同 的 候选 词语 序 
列 S ,来 寻找 使 条 件 概 率 PC(S1A) 取 最 大 值 的 那个 词语 序列 S$, 这 后 
者 就 是 当前 输入 语音 讯号 序列 A 所 对 应 的 输出 词 串 。 根 据 贝 叶 斯 
定律 (Beys law) ,上 式 可 以 转 写 为 : 

S 一 arg7zazsP(A|S)PCS)VP(CA) 【 品 5 熏 
由 于 公式 中 的 分 母 P (A) 在 语音 讯号 A 给 定时 ,是 一 个 归 一 化 
Cnormalization) 常 数 , 不 影响 极 大 值 orgrzazs 的 计算 ;因而 可 以 忽略 不 
计 , 即 把 它 从 公式 中 删除 。 于 是 ,得 到 如 下 语音 识别 的 统计 模型 : 

S 王 azrgmzazsP(A|S)PCS) 《SS 二 
其 中 ,P(A1S) 叫 做 声学 模型 (或 统计 语音 模型 ), 它 给 出 了 从 语句 S 
产生 出 语音 讯号 A 的 概率 。 一 般 来 说 ,统计 语音 模型 是 用 隐 马 尔 科 
夫 模型 来 建立 的 。P(S) 叫 做 统计 语言 模型 , 它 给 出 了 在 一 个 语言 
产生 语句 S 的 概率 。 

因此 ,语音 识别 系统 一 般 由 统计 语音 模型 和 统计 语言 模型 两 个 

部 分 组 成 。 直 观 地 说 ,语音 识别 就 是 搜索 S, 使 得 这 两 个 模型 的 概率 
的 乘积 P(A1S)XP(CS) 最 大 。. 


5.6 基于 统计 的 机 器 翻译 


基于 同样 的 原理 ,统计 学 机 器 翻译 使 用 统计 模型 来 刻画 语言 
译 的 过 程 , 并 且 自 动 地 从 平行 的 双语 语料库 中 训练 出 这 些 模型 的 参 
数 。 其 中 ,一 个 对 齐 (alignment) 程 序 从 双语 语料库 中 识别 出 对 应 的 
句子 。 对 于 每 一 对 相应 的 句子 ,统计 学 翻译 系统 认为 它们 是 一 个 通 
讯 信 道 Cchannel) 两 端的 信息 。 如 果 要 从 法 语 翻译 到 英语 ,英语 就 是 
这 个 信道 源 端的 发 送信 息 ,法 语 就 是 这 个 信道 末端 的 接受 信息 。 机 


@ 详 见 侈 富 良 、 王 野 (1998) ,第 20 一 21 页 ; 黄 昌 宁 (2002) ,第 80 一 81 页 。 
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器 翻译 的 任务 变 成 了 根据 接收 信息 来 解码 ,从 而 得 出 发 送信 息 。 这 
种 思路 在 一 定 程 度 上 正好 跟 传 统 的 机 器 翻译 相反 。 在 这 里 ,翻译 器 
的 任务 是 : 在 给 定 了 法 语句 子 下 的 情况 下 ,搜索 其 相应 的 英语 句子 
已, 使 得 后 验 概率 也 (五 | 下 ) 达 到 极 大 值 。 这 个 极 值 点 " 就 是 的 翻 
译 。 即 


瓦 " 一 Q7rg7202cP (五 | 开 ) 《5 65 防 
根据 贝 叶 斯 定律 ,上 式 可 以 转 写 为 : 
刁 * 一 C7B00EEPCED)P(ER|EED)7YPCE) 《5 人 的 


由 于 在 给 定 的 情况 下 ,P (F) 是 一 个 归 一 化 常数 ,不 影响 极 值 点 的 计 
算 。 因 此 ,任务 (5. 6. 2) 成 为 搜索 

瓦 * 一 arg720XZcP (五 ) 已 (下 | 五 ) 《56 3 
为 此 ,一 个 机 器 翻译 系统 必须 建立 统计 模型 ,用 于 刻画 概率 参数 
PCE) 和 PCFIE)。 其 中 ,刻画 PCE) 的 模型 叫 语言 模型 ,通常 用 三 元 
语法 作为 模型 。 刻 画 PCF| 巨 ) 的 模型 叫 翻译 模型 ,包括 两 种 语言 
词语 和 句子 的 对 齐 概率 、 在 某 种 对 齐 下 的 翻译 概率 等 参数 .9 


s$.7 基于 统计 的 词类 标注 


词类 标注 (partrof-speech tagging) 问 题 ,可 以 看 作 是 在 给 定 词 
的 序列 克 =z，t，…，ru 的 条 件 下 ,搜索 词类 标记 序列 C 一 ci， 
cj，…，c :使 得 PCC| 玉 ) 最 大 。 即 计算 如 下 条 件 概率 极 大 值 的 问 
题 ; 
C 王 arg7aazcP(CC| 信 ) (5 7 
P(CC| 丈 ) 表 示 已 知 输入 词 序 列 榴 的 情况 下 ,出现 词 类 标记 序列 C 的 
条 件 概率 。 数 学 符号 argmaxzc 表示 通过 考察 不 同 的 候选 词类 标记 
序列 C ,来 寻找 使 条 件 概 率 P (CI 丈 ) 取 最 大 值 的 那个 词类 标记 序列 
C, 这 后 者 就 是 对 词 序 列 克 的 词类 标注 的 结果 。 根 据 贝 叶 斯 定律 ， 
上 式 可 以 转 写 为 : 
C 王 azrg7202cP( 克 |CJ)PCC)VPCW) 《8 7 2 
由 于 公式 中 的 分 母 P(W) 在 词 序 列 叉 给 定时 ,是 一 个 归 一 化 常数 ， 


趾 ” 详 见 翁 富 良 、 王 野 (1998) ,第 166 一 70 页 。 
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不 影响 极 大 值 argmazc 的 计算 ;因而 可 以 忽略 不 计 , 即 把 它 从 公式 
中 删除 。 于 是 ,得 到 下 面 的 公式 : 

C 王 arg7a4zcP( 内 IC)PCC) (5579539 
接着 ,对 公式 进行 近似 运算 。 首 先 ,引入 独立 性 假设 ,@ 认 为 词 序列 
中 任意 一 个 词 w 的 出 现 概率 近似 只 跟 当前 词 的 词性 标记 c, 有 关 ， 
而 跟 上 下 文 的 词类 标记 无 关 。 即 词汇 概率 ( 某 个 词 以 某 种 词类 出 现 
的 概率 ) 为 ， 

王 (到 |1C)sIi-PCrs|ci) (5.7. 4) 
显然 ,这 是 一 种 一 元 语法 模型 , 它 只 考虑 词 跟 在 其 上 可 能 出 现 的 词类 
《标记 ) 之 间 的 统计 信息 , 即 一 个 词 用 作 某 种 词类 的 概率 。 其 次 ,采用 
二 元 假设 ,认为 任意 词类 标记 c; 的 出 现 概 率 只 跟 它 紧邻 的 前 一 个 词 
类 标记 c:: 相 关 。 即 

有 PCCP(E|c 动 《5 乱 : 
PR(cilc-i) 是 词类 标记 的 转移 概率 ,显然 这 是 一 种 二 元 语法 模型 ; 它 
只 考虑 词类 一 级 上 的 相 邻 上 下 文 关 系 ( 即 某 种 词类 序列 是 否 出 现 的 
统计 关系 ), 但 是 没有 考虑 特定 的 词 跟 某 种 词类 标记 之 间 的 统计 关系 
〈 即 一 个 词 用 作 某 种 词类 的 概率 )。 把 (5. 7.4) 和 (5. 7. 5) 两 式 代 人 
《5.7. 3) ,得 到 下 面 的 公式 : 

Carg71zazZcIi-nP(Cwi|lc)PCclc li) (526) 
这 个 公式 可 以 看 作 是 一 个 隐 马 尔 科 夫 模 型 ,模型 中 的 每 一 个 状态 对 
应 于 一 个 词类 标记 ;从 状态 S (对 应 于 词类 标记 c.) 到 状态 S (对 应 
于 词类 标记 c ) 的 转移 概率 (or 为 相应 的 词类 标记 的 二 元 语法 模型 已 
clc); 从 状态 S; 输出 词 w; 的 输出 概率 2 (rw;) 为 基于 一 元 语法 的 
词汇 概率 P(rw:|c) 。 于 是 ,词类 标注 问题 变 为 求 隐 马 尔 科 夫 模型 的 
最 佳 状态 序列 的 问题 。 这 种 问题 可 以 用 韦 特 比 算法 (Viterbi algo- 
rithm) 来 解决 。(5.7.6) 这 个 公式 ( 即 隐 马 尔 科 夫 模型 ) 中 的 两 个 概 
率 参 数 都 可 以 通过 训练 数据 ( 即 带 词类 标记 的 语料库 ) 来 分 别 估计 : 


@ 如 果 给 定 第 一 件 事 , 无 论 它 的 结果 是 什么 ,第 二 件 事 的 机 会 都 一 样 ;那么 ,这 两 件 
事 是 独立 的 。 否 则 ,就 是 不 独立 的 。 如 果 两 件 事 是 独立 的 ,那么 这 两 个 事件 都 发 生 的 机 会 
等 于 它们 各 自 无 条 件 概率 的 乘积 。 详 见 Freedman 等 (1991) 的 中 译本 ,第 256 一 258 页 。 
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PCro;|ci)szcotuztCroiyci)V/coxu7atCci) 并 寅 从 
P(ci|c_i)szcowrt(Cci-1ici)V couzitCcD1D7 《人 
公式 (5.7.7) 说 的 是 ,词汇 概率 约 等 于 : 训练 数据 中 某 词 rw 作 某 种 
词类 c, 使 用 的 次 数 , 除 以 该 词类 标记 c; 在 训练 数据 中 出 现 的 次 数 。 
公式 (5.7.8) 说 的 是 ,转移 概率 约 等 于 : 训练 数据 中 某 种 词类 标记 “， 
出 现在 另 一 种 词类 标记 c， 之 后 的 次 数 , 除 以 另 一 种 词类 标记 c-: 在 
训练 数据 中 出 现 的 次 数 。. 
因此 ,词类 标注 系统 一 般 由 词汇 概率 模型 和 转移 概率 模型 两 个 
部 分 组 成 。 直 观 地 说 ,词类 标注 就 是 搜索 词类 标记 序列 C, 使 得 这 两 
个 模型 的 概率 的 乘积 P(wlc)XxP(c lc-i) 最 大 。 据 Garside 等 
(1989) 报 导 , 他 们 用 上 述 方法 自动 标注 英语 词类 的 正确 率 达 到 
96%。 据 白 栓 虎 (1992: 61) 报 导 , 他 尝试 用 不 同 的 模型 来 自动 标注 
汉语 词类 : 单纯 用 词汇 概率 (一 元 语法 ) 模 型 时 正确 率 达 到 88. 3%， 
单纯 用 转移 概率 (二 元 语法 ) 模 型 时 正确 率 达 到 89.5%% ,用 这 两 种 概 
率 的 乘积 ( 隐 马 尔 科 夫 模 型 ) 时 正确 率 达 到 95.2%% 。 


5s.8 基于 统计 的 歧义 消解 


一 般 地 说 ,歧义 (ambiguity) 指 的 是 : 一 个 句法 结构 可 以 作 不 同 
的 语法 分 析 , 从 而 有 不 同 的 语义 理解 。 例 如 : 


(1) a。 The boy saw the girl with a telescope. 
b，The boy saw the girl with a telescope on the hill. 
(2) Perre Vinken，61 years old4，joined the board as a 


nonexecutive director。 


(1a) 中 的 介词 结构 with a telescope, 既 可 以 附加 在 动词 saw 上 作 状 
语 ,又 可 以 附加 在 名 词 girl 上 作 定 语 。(1lb) 中 的 介词 结构 on the 
hill, 既 可 以 附加 在 动词 saw 上 作 状 语 ,又 可 以 附加 在 名 词 girl 上 作 
定语 ,甚至 可 以 附加 在 名 词 telescope 上 作 定 语 ; 当 介 词 结 构 with a 


@， 详 见 公 富 良 、 王 野 (1998) ,第 170 一 174 页 ; 黄 昌 宁 (2002) ,第 81 一 2 页 ; 白 栓 虎 
(1992) ,第 49 一 53、61 一 62 页 。 
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telescope 和 on the hill 的 不 同 分 析 综 合 在 一 起 时 ,(1b) 就 有 多 种 语 
义 解 释 。 从 结构 (structure) 上 看 ,(2) 跟 (1a) 一 样 是 有 歧义 的 ;从 词 
汇 插 入 后 的 实例 (instance) 来 看 ,人 们 根据 词汇 之 间 的 语义 限制 ,只 
从 (2) 上 得 到 一 种 语义 解释 ;但 是 ,对 于 机 器 而 言 ,(2) 仍 是 有 歧义 的 ， 
可 以 给 出 两 种 结构 描述 。 由 于 介词 结构 附加 (PP attachment) 造 成 
的 歧义 具有 普遍 性 和 典型 性 ,因而 大 多 数 统计 学 歧义 消解 的 研究 集 
中 在 这 一 问题 上 。 

为 了 用 计算 机 来 求解 介词 结构 的 正确 附加 ,必须 用 一 种 合适 的 
知识 表示 ( 即 形式 化 ) 来 描述 这 个 问题 。 比如 ,首先 ,用 词类 范畴 来 表 
示 输 入 句子 的 骨架 ,于 是 介词 结构 的 附加 问题 可 以 简化 为 ; 在 具有 
Verb 71 力 1 ( 力 re 力 ?zz ) 形 态 的 语句 中 ,介词 结构 (ze ?22 ) 应 该 附加 于 
zer8 (动词 ) 还 是 ap (名 词 短语 ) 的 问题 。 接 着 ,用 随机 变量 A 表示 
2rep zp。 的 附加 ,人 的 值 可 取 VB ( 指 附 加 于 动词 ) 或 NP( 指 附加 于 
名 词 ); 最 后 ,用 zw 表示 语句 中 除了 verb mpi (prep xp) 之 外 的 词 。 
在 这 种 情况 下 ,如 果 有 一 个 已 经 标注 了 句法 结构 的 语料库 作为 训练 
数据 (比如 , 宾 州 大 学 树 库 ,Upenn Treebank) 可 资 利用 ,那么 就 可 以 
由 概率 分 布 P (4A1prep，zerg，zapi，zzps，w) 来 确定 某 一 种 附加 的 
可 能 性 。 引 入 独立 性 假设 ,假定 上 述 概率 分 布 独立 于 刀 , 并 独立 于 
?zz ，72z2 中 除 中 心 名 词 (head noun) 以 外 的 其 他 部 分 ; 那 和 

忆 (A|zpre 力 ，verp，72Dp ，12j ，) >: 

了 (CA|pre 力 ，verp，7zoz72l ， 720MW722 ) (5 
其 中 ,zxoxm 是 az 的 中 心 名 词 ,xzoxzs 是 az 的 中 心 和 名词， 如果， 

己 CNP|zre 力 ，ver，7ox7i ,7ou723 ) 全 

PCVB | 加 re 加 ，verb，720u721 ，7ot772 ) 
那么 ,判定 介词 结构 附加 于 名 词 短语 ;否则 ,判定 介词 结构 附加 于 动 
词 。 

由 于 用 上 述 模型 来 刻画 介词 结构 的 附加 时 ,是 用 个 别 词 而 不 是 
词类 来 进行 统计 的 ,因而 该 模型 中 有 太 多 的 自由 参数 ， 比如 ,假定 日 
常 英语 中 有 10'4 个 名 词 .103 个 动词 .10 个 介词 ,那么 该 模型 大 约 有 
10 ”个 自由 参数 。 事实 上 许多 事件 ( 即 某 些 名 词 或 动词 跟 某 些 介词 
结构 的 搭配 序列 ) 在 语料库 中 根本 没有 出 现 过 ,这 会 导致 严重 的 数据 
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稀 玻 ( 即 训 练 不 足 ) 问 题 。 所 以 在 实际 的 实现 中 ,可 以 采用 后 撤 
(back-off) 算 法 。 当 找 不 到 四 个 中 心 词 的 四 元 组 时 ,就 退 一 步 找 一 个 
三 个 中 心 词 的 三 元 组 ,以 此 类 推 ;直至 退 到 一 元 组 时 ,只 根据 具体 的 
介词 来 作出 判断 。 这 是 一 种 用 低 元 语法 来 平滑 高 元 语法 ,从 而 解决 
数据 稀 朴 问题 的 方法 。 或 者 ,直接 对 模型 P (A|zre 轧 ，vwerp，7?7ox7al ， 
zozz ) 作 进一步 的 简化 ,作出 如 下 独立 性 假设 : 
P(A 王 NP|zpre 力 ，uerb，720721 ，720z712 ) 
As 了 (NP|zpre 轧 ，7zox721 ) 
P(A 王 VB | re 力 ，verp，720U721 ，720U722 ) 
AP (VB | pre 力 ，Vverpb) (58 二 幼 
也 就 是 说 ,假定 介词 结构 的 附加 跟 介 词 后 面 所 跟 的 名 词 不 相关 ;并 
且 , 介 词 短语 附加 于 宾语 时 跟 动词 不 相关 ,介词 短语 附加 于 动词 时 跟 
宾语 不 相关 。 还 可 以 进一步 假设 : 
P(A = NP | preb，zoxi) 之 P(A 一 VB | zre 加 ,ve7D) 
T 
PCpreb | moxzi) 盖 PCbret | verb) (583 
也 就 是 说 ,简单 地 通过 比较 介词 跟 中 心 语 名 词 的 共 现 概率 与 介词 跟 
动词 的 共 现 概率 的 大 小 ,来 估计 哪 一 种 附加 的 可 能 性 更 大 。 根 据 最 
大 似 然 估计 原理 ， 
卫 〈 四 re 力 | zox721 ) 人 


coa1z (为 re 力 Attach-to 720t721 )/coz7t (72OUITa ) (5. 8. 4) 
王 〈zre 力 | verp) 人 
co (zre 力 Attacj to terp)/coz7it 〈De7D) 《5 8. 5 


像 counz (breb Attach io moxzai) 和 cout (Zre 访 Aitach io verpg) 等 概 
率 参 数 ,可 以 在 标注 了 语法 结构 关系 的 树 库 中 得 到 。 也 可 以 通过 非 
歧义 的 数据 来 估计 ,比如 , 当 一 个 名 词 前 面 没有 动词 ,后 面 跟 有 一 
个 介词 结构 PP( 介 词 为 如) 时 ,将 coxztz (zPre 户 Aitach-to 7oumi ) 加 
一 ; 当 一 个 介词 结构 PP( 介 词 为 访 前 面 既 有 动词 ", 又 有 名 词 短语 
7 为 ,但 该 zj 是 一 个 代词 时 ,将 coxzt (pre 如 Aitach-to verp) 加 一 。 通 
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过 诸如 此 类 的 规则 来 获得 相关 的 概率 参数 .9 
6 语言 的 递归 性 和 语言 学 规则 的 结构 依赖 性 


6.1 语言 的 递归 性 和 语言 官能 


众所周知 ,语言 在 结构 方式 上 具有 递归 性 (recursion) 的 特点 ， 
突出 地 表现 为 : 一 个 按照 某 种 语法 模式 造成 的 语法 组 合 , 其 直接 成 
分 可 以 也 是 按照 这 种 结构 模式 (或 其 他 结构 模式 ) 造 成 的 语法 组 
合 .@ 比如 ,8$2.4 中 的 例 (1)(2) 诸 例 ; 再 如 : 


(1) The mouse the cat the dog chased bit died. 
(2) a。 The man who ……: is here. 
b. Isaw a……… house. 
(3) 这 件 事 儿 ,我们 几 个 人 中 间 ,小 王 现在 态度 最 不 明朗 。 
(4) 我 不 知道 小 李 知 道 不 知道 她 丈夫 已 经 知道 她 没有 通过 
律师 资格 考试 。 


当然 , 像 例 (1) 这 样 极 端的 例子 在 真实 的 语言 交际 中 是 不 常见 的 ;但 
是 ,我 们 不 能 保证 一 定 碰 不 到 像 例 (3)(4) 那 样 的 句子 。 正 如 Chom- 
sky〈1957: 17) 所 说 的 , 像 例 (2) 的 …… 处 可 以 分 别 插入 任意 长 度 的 
动词 性 词组 和 形容 词性 词组 。 如 果 用 产生 式 规 则 (production rule) 
来 表示 短语 结构 的 形成 过 程 ,那么 递归 性 就 表现 为 箭头 左 侧 的 符号 
可 以 出 现在 箭头 的 右 侧 , 甚 至 连 初 始 符号 S 也 可 以 出 现在 箭头 的 右 
侧 .9 例如 


CC5》 这 六 二 人 BT 二 VEP 


@ 详 见 翁 富 良 . 王 野 (1998) ,第 177 一 180 页 ; 黄 昌 宁 (2002) ,第 82 一 83 页 。 

@ “参考 Hockett (1958) ,中 译本 第 194 一 200 页 。 

图 ”参考 Hartmann，R. R. 玉 . & F.C. Stork (1972) Dictionmrary o 太 Laxzgzuage azdt 
工 izgzxwzisics〔(Applied Science Publishers Ltd。London) 中 的 recursiveness( 循 环 性 ) 条 目 。 
见 中 译本 《语言 与 语言 学 词典 》 黄 长 著 、 林 书 武 . 卫 志 强 、 周 绍 玉 译 , 李 振 麟 、 俞 琼 校 ,上 海 
辞书 出 版 社 ,1981 年 ) ,第 292 页 。 另 外 , 徐 烈 灿 先 生 在 岳 草 论坛 (2002) 上 也 提 及 这 一 点 。 


66 基于 认 知 的 汉语 计算 语言 学 研究 


还 -NP 一 Det 十 N 
NE 一 ENSECS) 
iTNP 
让 = 十 teVP 


在 (5iii) 中 ,初始 符号 S 可 以 作 名 词 N 的 定语 从 名 ;这样 形 成 的 名 词 
性 成 分 可 以 分 别 代 入 (5 中 的 NP 和 (5iv) 中 的 NP, 再 把 (5iv) 这 样 
的 动词 性 成 分 代入 (5D 中 的 VP ,就 构成 下 面 这 种 句子 


〈《6) The man (who kicked the ball) scored the goal (that 


won the game). 


〈 蝇 球 的 那个 人 踢 进 了 赢得 这 场 比赛 的 一 个 球 。) 


递归 性 是 人 类 语言 的 一 个 非常 重要 的 特性 , 它 把 人 类 语言 跟 其 
他 动物 的 交际 符号 系统 区 别 开 来 。Hauser，Chomsky and Fitch 
《2002) 甚 至 认为 递归 性 是 反映 人 类 语言 官能 (the faculty of lan- 
guage， 简 称 FL) 的 基本 属性 。 他 们 把 语言 官能 分 成 广义 和 狭义 两 
种 ,广义 的 语言 官能 CFL in broad sense, 简称 FLB) 包 括 内 在 的 运算 
系统 (computational system) 和 两 个 内 部 的 有 机 体系 统 :“ 感 觉 - 运 
动 ”Csensory-motor) 系 统 和 “概念 - 意 向 ”(conceptual-intentional) 系 
统 。 狭 义 的 语言 官能 (FL in narrow sense, 简 称 FLN) 只 包括 抽象 的 
语言 运算 系统 , 即 狭义 句法 Cnarrow syntax) 。 这 些 不 同 的 系统 的 关 
联 方式 是 : 运算 系统 生成 内 部 表达 ,并 通过 音 系 系统 把 它们 映射 到 
感觉 -运动 接口 ,通过 (形式 ) 语 义 系统 把 它们 映射 到 概念 -意向 接口 。 
FLN 的 基本 属性 是 递归 , 它 用 有 限 的 元 素 集合 来 造成 潜在 的 无 限 的 
离散 的 表达 。 每 一 个 这 种 离散 的 表达 被 送 到 感觉 -运动 系统 和 概念 - 
意向 系统 ,再 由 它们 在 使 用 语言 的 过 程 中 来 处 理 和 细 化 这 些 信息 。 
虽然 FLN 具有 递归 能 力 , 但 是 FLN 或 FLB 之 外 的 许多 内 部 机 体 因 
素 对 使 用 这 个 系统 施加 实际 的 限制 。 比 如 , 肺 容 量 限 制 了 实际 口语 
句子 的 长 度 , 工 作 记忆 对 句子 的 复杂 性 施加 限制 以 利于 句子 可 以 被 
理解 。 从 现 有 的 研究 来 看 ,FLB 的 许多 方面 是 人 类 和 其 他 兰 椎 动物 
共有 的 ,但 是 属于 FLN 的 核心 的 递归 方面 在 动物 交际 和 可 能 的 其 他 
领域 中 都 没有 任何 类 似 物 (p. 1570 一 1571) 。 由 于 有 限 状 态 语法 只 能 
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反映 局 部 的 依存 关系 (local dependencies) ,因而 它 不 能 充分 地 抓 住 
任何 人 类 语言 。 因 为 自然 语言 可 以 通过 在 短语 中 递归 地 岩 人 短语 来 
超越 纯粹 的 局 部 结构 ,从 而 导致 统计 规律 (statistical regularities ) 被 
任意 数目 的 词 或 短语 打 乱 。 这 种 长 距离 的 层级 关系 在 所 有 的 自然 语 
言 中 都 存在 ,这 使 得 短语 结构 语法 成 为 必 不 可 少 (p. 1577) 。 他 们 还 
从 人 和 其 他 动物 比较 进化 (comparative evolution) 的 角度 推测 ,人 类 
的 递归 运算 能 力 不 一 定 是 为 了 语言 而 发 展 出 来 的 ,而 极 有 可 能 是 为 
了 数 数 . 航 行 和 社会 关系 等 非 交 际 原因 。 可 能 源 于 特定 的 自然 选择 
的 压力 `\ 人 类 所 独 具 的 进化 历史 、 或 者 是 其 他 种 类 的 神经 重新 组 织 的 
后 果 ( 副 产品 )(p. 1578) 。 

不 管 怎么 说 ,自然 语言 的 递归 性 是 基于 统计 的 语言 处 理 模型 的 
头号 敌人 。 


6.2 语言 学 知识 的 结构 依赖 性 


归根 结 底 , 这 都 是 由 语言 学 知识 的 结构 依赖 性 (structure-de- 
pendent) 特 点 造成 的 。 语 言 学 知识 的 结构 依赖 性 特点 ,是 它 不 同 于 
人 类 其 他 知识 的 地 方 。 正 是 根据 这 一 点 , 乔 姆 斯 基 强 调 语言 能 力 不 
同 于 人 类 的 其 他 认 知 能 力 。Chomsky (1980) 非 常 直 观 地 用 英语 是 
非 问 句 (yes-or-no question) 的 形成 过 程 , 来 说 明 语 言 学 规则 具有 结 
构 依 赖 的 特性 。 例 如 : 

(1) The man is here. 一 Is the man here? 
The man will leave. 一 Will the man leave? 

当 考 察 了 上 述 范 围 极 其 有 限 的 陈述 句 和 疑 问 名 配对 (declarative- 
question pair) 后 ,我 们 或 许可 以 提出 下 列 两 种 假设 (hypotheses) 来 
解释 怎样 从 陈述 名 上 推导 出 疑问 句 : 


Hi : 在 陈述 句 中 自 左 向 右 逐 词 搜索 ,直到 发 现 首先 出 现 的 
is，will 一 类 词 ;然后 把 它 放 到 句 首 ,就 形成 了 相应 的 斤 问 句 。 

Hs : 在 陈述 句 中 自 左 向 右 逐 词 搜索 ,直到 发 现 首先 出 现在 
第 一 个 名 词 短语 之 后 的 is，will 一 类 词 ;然后 把 它 放 到 名 首 ,就 
形成 了 相应 的 疑问 句 。 
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像 也 这 种 假设 ,可 以 称 为 “ 跟 结 构 无 关 的 规则 ”(structure- 
independent rule) ; 像 Hs， 这 种 假设 ,可 以 称 为 “依赖 于 结构 的 规则 ” 
Cstructure-dependent rule) 。 因 为 ，Hi 只 需 把 陈述 句 分 析 为 一 个 词 
的 序列 ( 即 一 连 捉 词 ,a sequence of words)3; 而 五。 除了 需要 把 陈述 
句 分 析 为 一 个 词 的 序列 外 ,还 需要 把 陈述 句 分 析 为 名 词 短语 之 类 的 
抽象 的 短语 。 之 所 以 说 短语 是 抽象 的 ,是 因为 它们 只 是 一 种 心理 结 
构 (Cmental constructions) ,它们 的 边界 (boundaries) 和 类 别 标定 (la- 
beling) 并 不 通过 某 种 方式 用 一 般 的 物理 形式 标记 出 来 。 尽 管 如 此 ， 
人 们 还 是 愿意 选择 像 H, 这 种 假定 了 抽象 的 心智 加 工 过 程 (abstract 
mental processing) 的 假设 ;因为 , 它 比 Hi 更 接近 事实 。 比如 ,假如 
有 下 列 陈述 句 : 


(2) The man who is here is tal]. 
The man who is tall will leave. 
根据 假设 H; ,可 以 得 出 下 列 正确 的 疑问 名 : 
(3) Is the man who is here tall? 
Will the man who is tall leave? 
但 是 ,根据 假设 Hi , 却 得 出 了 下 列 不 合格 的 疑问 句 : 
(4) x Is the man who here is tall? 


x Is the man who tall will leave? 


换 句 话说 ,假设 H; 正确 地 预测 了 (2) 和 (3) 之 间 的 语法 联系 ,而 假设 
H, 根本 做 不 到 。 通 过 这 些 例 子 , 乔 姆 斯 基 企 图 证 明 : 儿童 是 怎样 知 
道 H; 是 接近 正确 的 呢 ? 显然 没有 人 告诉 过 他 Hi 不 对 ,Hs 正确 之 
类 的 相关 证 据 。 其 实 ,儿童 不 需要 考虑 Hi 之 类 的 假设 ,他 的 大 脑 的 
初始 状态 (Cinitial mental state) 的 特性 二 开始 就 排除 了 Hi 这 种 跟 结 
构 无 关 的 规则 .了 


6.3，” 花 园 幽 径 句 挑战 概率 语法 
我 们 对 乔 姆 斯 基 这 种 语言 天 赋 的 结论 不 感 兴趣 ,本 文 关 心 的 是 


@ 详 见 Chomsky (1980) ,p. 39 一 40. 
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基于 统计 的 语言 模型 能 否 获得 在 根本 上 是 结构 依赖 的 结构 化 的 语言 
知识 。 情 况 看 上 去 并 不 乐观 。 比 如 ,自然 语言 中 有 一 种 在 句子 的 局 
部 有 歧义 ,但 整个 句子 没有 歧义 的 句子 。 例 如 : 


《1) a。The horse raced past the barn fell. ( 跑 过 饲料 房 的 

马 倒 下 了 刁 

b. The student forgot the solution was in the back of 
the book. 
(学 生 忘记 了 答案 在 这 本 书 的 背面 。) 

c，The complex houses married and single students 
and their families. 
(综合 建筑 物 中 住 着 结婚 的 和 独身 的 大 学 生 以 及 他 
们 的 家 庭 。) 


当 人 们 读 到 (la) 的 前 一 段 The horse raced past the barn( 马 跑 过 了 
饲料 房 ) 时 ,一般 会 以 为 这 已 经 是 一 个 完整 的 句子 了 。 再 往 下 读 到 另 
外 一 个 动词 fell 时 , 才 发 觉 raced 原来 并 不 是 句子 中 的 主要 动词 , 它 
是 修饰 名 词 horse 的 定语 从 句 中 的 主要 动词 ,最 后 读 到 的 fell 才 是 
这 个 句子 的 主要 动词 。 人 们 对 这 种 句子 的 理解 方式 ,犹如 漫步 在 花 
园 中 曲折 的 幽 径 上 ,出 口 在 哪儿 并 不 是 一 目 了 然 的 。 据 此 ,Bever 
《1970) 形 象 地 称 这 种 句子 为 花园 幽 径 名 (garden path sentence) 。 后 
来 ,Trueswell (et al. ) 〈1993) 讨 论 了 (1lb) 这 样 的 花园 幽 径 句 。 显 
然 ,(1la) 跟 (1b) 相 对 称 , 前 者 是 主语 中 包含 不 带 thatuwhich 类 关系 
代词 的 定语 从 名 ,使 人 误 以 为 主语 中 的 核心 名 词 跟从 名 中 的 动词 性 
成 分 是 一 个 完整 的 主 谓 结构 ;后 者 是 宾语 中 包含 不 带 thiat which 类 
关系 代词 的 定语 从 名 ,使 人 误 以 为 宾语 中 的 核心 名 词 跟 主 句 中 的 动 
词性 成 分 是 一 个 完整 的 述 宾 结 构 。 而 (lec) 在 理解 上 的 回潮 CbacK- 
tracking), 则 是 由 complex 和 houses 的 词性 歧义 造成 的 : 在 读 济 
The complex houses 时 ,人 们 一 般 以 为 这 是 一 个 名 词 词组 ,complex 
是 形容 词 , 它 修饰 名 词 house。 但 是 , 当 继续 向 前 读 到 married and 
single 的 时 候 , 会 感到 非常 迷 侦 ,不 明白 究竟 是 什么 意思 ;最 后 读 到 
句子 末尾 的 时 候 , 才 钼 然 大 悟 : complex 不 应 该 理解 为 形容 词 ? 而 应 
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该 理解 为 名 词 ;house 也 不 应 该 理解 为 名 词 ,而 应 该 理解 为 动词 。 这 
时 ,整个 句子 的 意思 才 真 正明 白 .9 
冯 志 伟 、. 许 福 吉 (2002) 指 出 ,汉语 中 也 有 类 似 的 花园 幽 径 句 ; 特 
别 是 当 潜 在 的 歧义 结构 ( 即 歧义 格式 ) 在 实例 化 (instanciation, 即 填 
入 具体 的 词汇 ) 过 程 中 变 成 了 现实 的 歧义 结构 后 ;如 果 把 它们 嵌入 更 
大 的 结构 中 ,那么 往往 会 造成 花园 幽 径 句 。 例 如 : 
(2) a 小 王 研究 和 鲁迅 的 文章 -> 小 王 研究 鲁迅 的 文章 发 表 
5 
b. 咬 死 了 猎人 的 狗 -> 咬 死 了 猎人 的 狗 逃 跑 了 。 


有 的 句法 结构 本 来 没有 歧义 ,但 当 后 面 出 现 新 的 成 分 后 , 原 有 的 结构 
要 发 现 变 化 ,并 导致 语义 解释 的 改变 。 例 如 : 


(3) 老 张 讨厌 小 王 -> 老 张 讨厌 小 王 (的 ) 不 老实 。 


甚至 后 面 出 现 新 的 成 分 后 , 原 有 的 结构 格局 可 以 保持 ,但 语义 解释 改 
变 并 导致 语义 怪异 。 例 如 : 


《42as ， 玉 更 死 了 一 王 寻 死 了 父亲 ,。 
b. 中 国 队 打 败 了 -~ 中 国 队 打 败 了 科威特 队 。 


他 们 认为 ,汉语 的 (2) 和 (3) 分 别 跟 英语 的 (la) 和 (1b) 相 似 ; 但 是 , 像 
(4) 这 样 的 语义 花园 幽 径 句 是 英语 所 没有 的 。 

对 于 花园 幽 径 句 的 歧义 段 的 分 析 , 由 于 人 们 一 般 总 是 先 选 择优 
先 的 结构 (如 把 “小 王 研究 鲁迅 的 文章 ?理解 为 主 谓 结构 ); 直 到 句子 
快 结束 时 (如 读 完 “小 王 研究 鲁迅 的 文章 发 表 了 ?2) , 才 发 觉 非 优先 的 
结构 (作为 偏 正 结构 的 “小 王 研究 鲁迅 的 文章 ”) 才 是 正确 的 结构 。 同 
样 ,在 计算 机 自动 分 析 这 类 句子 的 过 程 中 ,往往 会 出 现 大 量 的 回 淹 ， 
从 而 影响 了 自动 分 析 的 效率 。 可 喜 的 是 , 汉 志 伟 、 许 福 吉 (2002) 报 
导 ;: 他 们 基于 上 下 文 无 关 语 法 规则 ,采用 欧 雷 算法 (Earley Algo- 


四 ”本 段 内 容 , 详 见 汉 志 伟 、 许 福 吉 (2002) ,第 1 一 3 页 . 
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rithm) ,9 成 功 地 处 理 了 英语 和 汉语 中 的 花园 幽 径 句 。 由 于 欧 雷 算法 
使 用 点 规则 (dotted rule) ,把 自 顶 向 下 (top-down) 的 “预示 ”(predic- 
tor) 和 自 底 向 上 (bottom-up) 的 “扫描 ”(scanner) 很 巧妙 地 结合 起 来 ; 
因而 用 以 处 理 花园 幽 径 句 时 ,完全 避免 了 回溯 ,提高 了 分 析 的 效率 。 
在 这 种 实践 的 基础 上 ,他 们 对 概率 语法 有 如 下 中 肯 的 评论 ; 


近年 来 ,在 大 规模 真实 文本 的 自动 处 理 中 ,有 的 学 者 提出 了 
概率 上 下 文 无 关 文 法 ,他 们 主张 从 经 过 加 工 的 语料库 ( 树 库 ) 中 
统计 出 上 下 文 无 关 文 法 规则 的 出 现 概 率 , 然 后 在 语言 自动 分 析 
中 ,根据 规则 概率 的 大 小 来 优选 概率 大 的 规则 ,从 而 减少 分 析 过 
程 中 对 于 小 概率 规则 的 搜索 操作 ,提高 文法 的 分 析 效率 。 

在 上 下 文 无 关 文 法 中 引入 概率 的 因素 ,在 绝 大 多 数 情况 下 ， 
无 疑 是 有 积极 作用 的 。 这 是 自然 语言 研究 中 的 一 个 很 大 的 进 
展 。 但 是 , 当 我 们 分 析 花 园 幽 径 句 的 时 候 , 概 率 语 法 却 会 遇 到 轩 
难 。 这 时 ,由 于 概率 大 的 规则 反而 是 分 析 中 不 正确 的 选择 ,而 那 
些 概率 小 的 规则 恰恰 是 分 析 中 的 正确 选择 ,使 用 概率 语法 会 感 
到 束手无策 。 因 此 ,在 花园 曲 径 句 的 自动 分 析 中 ,概率 ”起 的 作 
用 是 非常 特殊 的 。 这 说 明 ,概率 语法 并 不 是 所 向 无 敌 的 ,也 不 是 
万 能 的 。 花 园 幽 径 名 的 存在 ,是 对 概率 语法 的 一 个 挑战 。 在 自 
然 语 言 的 自动 处 理 中 ,我 们 应 该 看 到 概率 语法 的 这 种 局 限 性 ,把 
基于 统计 的 方法 和 基于 规则 的 方法 紧密 地 结合 起 来 ,才能 克服 
概 牵 语法 的 这 种 局 限 性 。( 第 21 页 ) 

还 是 应 了 一 名 老话 : 语言 现象 比 语言 理论 丰富 。 同 样 ,语言 现象 比 

任何 一 种 语言 处 理 方法 或 模型 都 要 来 得 复杂 。 因 此 , 想 单 任 一 种 方 

法 或 模型 来 独 打 天 下 的 想法 是 不 切实 际 的 。 


@ 关于 欧 雷 算法 , 详 见 Earley (1970); 翁 富 良 、 王 野 闻 (1998) 8 5.2:“ 上 下 文 无 关 语 
法 的 识别 和 分 析 算法 ?之 三 “ 欧 雷 算法 ”中 有 简要 的 介绍 ,第 69 一 70 页 ; 汉 志 伟 、. 许 福 吉 
〈2002) 一 文中 有 具体 的 解释 和 运用 。 
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7 基于 统计 的 语言 处 理 模 型 的 局 限 性 


7.1 独立 性 假设 : 统计 语言 模型 的 双 刃 剑 


上 面 从 语言 学 理论 上 说 明 ,基于 统计 的 语言 处 理 模型 在 根本 上 
会 碰 到 不 可 克服 的 困难 。 下 面 , 我 们 从 统计 模型 内 部 说 明 这 种 方法 
的 局 限 性 。 根 据 8 1 的 讨论 ,自然 语言 不 是 有 限 状 态 语言 ,自然 语言 
的 语句 中 的 符号 串 不 是 一 种 马尔 科 夫 链 。 这 样 , 符 号 串 中 某 个 当前 
符号 的 出 现 概率 并 不 是 单纯 地 由 前 一 个 符号 决定 的 ,甚至 在 理论 上 
无 法 统一 地 知道 到 底 是 由 其 前 的 多 少 个 符号 决定 的 。 但 是 ,统计 模 
型 必须 假定 当前 符号 的 出 现 概率 是 由 其 前 的 多 少 个 符号 决定 的 ,这 
就 是 8$ 5. 2 中 的 N 元 语法 模型 。 这 里 ,引入 了 概率 论 上 的 独立 性 假 
设 : 假定 N 十 1 个 符号 出 现 这 个 事件 的 机 会 只 跟 其 前 的 N 个 符号 的 
出 现 相 关 , 但 是 跟 语句 中 的 其 他 符号 的 出 现 与 否 都 无 关 。 这 已 经 跟 
语言 的 实际 情况 相对 立 了 。 并 且 , 在 实际 构造 和 实现 统计 模型 的 时 
候 , 为 了 避免 自由 参数 太 多 而 造成 的 计算 上 的 指数 爆炸 ,同时 为 了 克 
服 训练 例 中 数据 稀 朴 的 困难 ;这 个 N 的 数目 不 能 太 大 ,通常 要 减少 
到 3 以 下 才能 实施 。 这 样 ,势必 使 得 这 种 基于 统计 的 语言 处 理 模型 
离 语言 事实 越 来 越 远 了 。 

简单 地 说 ,独立 性 假设 是 一 把 双 刃 剑 : 基于 统计 的 语言 处 理 模 
型 借助 于 独立 性 假设 ,使 得 统计 模型 得 以 实施 ;但 是 ,独立 性 假设 过 
度 地 简化 了 语言 模型 ,使 得 统计 模型 只 能 处 理 对 结构 关系 依赖 性 不 
强 的 对 象 ,而 像 代词 的 先行 词 求解 .长 距离 依存 关系 等 依赖 结构 关系 
的 结构 化 对 象 , 则 较 难 用 统计 模型 来 处 理 。 不 幸 的 是 , 绝 大 部 分 语言 
学 知识 和 语法 规则 都 具有 结构 依赖 的 性 质 , 它们 使 得 独立 性 假设 失 
效 , 从 而 使 得 统计 模型 难以 施展 神威 。 


7.2 一 个 实验 : 介词 结构 消 歧 的 条 件 


据 黄 昌 宁 (2002: 83) 介 绍 ,Collins and Brooks (1995) 用 $5. 8 
中 的 概率 统计 方法 来 进行 介词 结构 消 歧 实验 。 他 们 采用 宾 州 大 学 提 
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供 的 带 有 句法 标注 的 华尔街 日 报 (WSJ) 树 库 , 从 中 抽出 20,801 个 四 
元 组 作为 训练 集 , 其 余 的 3,097 个 四 元 组 作为 测试 集 。 并 把 机 器 自 
动 判定 的 结果 跟 人 在 不 同 条 件 下 的 判定 结果 进行 比较 ， 


实验 条 件 
一 律 视 为 名 词 附加 ( 即 4=NP) 

只 考虑 句 中 介词 p 的 最 常见 附加 
机 器 根据 四 个 中 心 词 判断 

三 位 专家 只 根据 四 个 中 心 词 判断 
三 位 专家 根据 全 名 判断 


59.0 听 
72.2 上 % 
84. 1 听 
88. 2 听 


显然 ,自动 判断 的 精确 率 的 下 限 是 72. 2% ,因为 机 器 根据 四 个 中 心 
词 来 判断 ,不 会 比 只 考虑 句 中 介词 p 的 最 常见 附加 做 得 更 差 ;上 限 是 
88. 2 汶 ，, 因 为 同样 根据 四 个 中 心 词 来 判断 ,机 器 不 会 比 专家 更 高 明 。 
虽然 自动 判断 的 精确 率 84. 1%% 离 上 限 88. 2%% 不 远 ,但 是 离 实际 应 用 
的 需要 还 有 距离 。 究 其 原因 ,语法 规则 的 结构 依赖 性 未 必 是 N 元 语 
法 模型 所 能 欢 近 的 ,更 何况 除了 语言 知识 之 外 , 语 篇 上 下 文 知识 和 世 
界 知识 对 语言 理解 也 产生 影响 ;因此 ,即使 是 人 类 专家 、 即 使 阅读 了 
全 句 , 也 未 必 能 正确 地 判断 出 介词 结构 的 正确 附加 。 语 言 自动 处 理 
的 困难 性 ,由 此 可 见 一 斑 。 


7.3 一 点 疑问 : 语义 等 价 类 能 管 多 大 用 处 ? 


从 上 面 介词 结构 消 歧 的 例子 来 看 ,不 管 是 人 还 是 机 器 ,为 了 达到 
80 为 以 上 的 正确 率 , 就 得 考虑 四 个 中 心 词 , 即 使 用 四 元 语法 模型 , 但 
是 ,这 就 马上 带 来 计算 量 大 和 数据 稀疏 的 问题 。 为 了 解决 这 个 问题 ， 
可 以 采用 划分 等 价 类 的 办 法 ,把 名 词 和 动词 按 其 语义 划分 成 若干 等 
价 类 ,从 而 把 相关 于 一 个 个 具体 的 名 词 和 动词 的 介词 结构 附加 模型 
转变 成 相关 于 这 些 语义 等 价 类 的 模型 。 比 如 ,把 Monday，today， 
March 划 归 等 价 类 TIME ,把 John， baby，boy，girl，artist 划 归 等 
价 类 HUMAN。 这 样 ,介词 结 构 附 加 模型 不 是 相关 于 具体 的 名 词 和 
动词 ,而 是 相关 于 这 些 词 所 属 的 类 。 即 


PCA|zre 回 ，verB，7zoz7za ,7zot71y ) 一 
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忆 C(A|zrez,cCuerp) ycCzaoz72l ) ,CC72OU72z ) ) 《7 3 功 
其 中 ,cCX) 是 词 X 所属 的 语义 等 价 类 。 由 于 等 价 类 的 数目 远 远 小 于 
具体 的 名 词 和 动词 的 数目 ,因而 公式 (7. 3.1) 大 大 地 减少 了 自由 参数 
的 数量 。 如 果 进 一 步 假设 : 
P (CNP | prezp ,CCuwerBp ) ,cC7zotu721 ) ,CC7OU722 ) ) 一 
PCVB | prebycCoerb)，cCzox72i)，cC7zox722 7) 
T 
PP (cCzoxmzl ) ，cCzox72z ) | zre 如 ) 之 
PKCcCzerp) ,c(Czoxzaz ) | zez) (2 
廿 就 是 说 ,简单 地 比较 在 特定 介词 的 情况 下 ,介词 后 的 名 词 所 属 的 语 
文 等 价 类 ,到 底 跟 中 心 语 名 词 所 属 的 语义 等 价 类 的 共 现 概率 高 ,还 是 
跟 动 词 所 属 的 语义 等 价 类 的 共 现 概率 高 ,来 估计 哪 一 种 附加 的 可 能 
性 更 大 。 这 里 的 P〈cCzoxza ) ，c(C7zox7zzz ) | re 力 ) 和 P(cGCverp)，< 
(7zoz7z ) | re 力 ) ,可 以 根据 最 大 似 然 估计 原理 来 求 得 。 同 样 可 以 采用 
$ 5.8 所 述 的 办 法 ,从 非 歧义 的 数据 中 得 到 最 大 似 然 估 计 所 需要 的 
有 关 事件 的 计数 .0 
这 里 事实 上 引进 了 一 个 假设 : 相同 语义 类 的 词 具 有 相同 的 语法 
表现 (Cgrammatical behavior) 。 这 是 二 个 有 待 验证 的 假设 。 根 据 我 
们 初步 的 经 验 ,相同 语义 类 的 词 不 一 定 具 有 相同 的 语法 表现 ;因此 ， 
它们 未 必 可 以 划 入 相同 的 词类 。 汉 语 中 有 名 的 例子 是 : 
打仗 (动词 ) 一 战争 (名 词 ) 金 \. 银 (区 别 词 ) 一 铜 、 铁 、 锡 (名 
词 ) 
绿 ( 形 容 词 ) 一 碧绿 (区 别 词 ) 红 ( 形 容 词 ) 一 通红 (状态 词 ) 
突然 (形容 词 ) 一 忽然 (副词 ) 刚才 (时 间 词 ) 一 刚刚 (副词 ) 


属于 相同 意义 范畴 的 动词 ,不 一 定 能 构成 相同 的 句 式 。 例 如 :2 


(1) a Joe gave $5 to the earthquake relief fund. 
-> b。 Joe gave the earthquake relief fund $5. 


@ 详 见 翁 富 良 、 王 野 户 (1998) ,第 177 一 180 页 。 
@ “例子 和 说 明 , 根 据 Goldberg (1995),p.121、130 一 131 改编 。 
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〈2) a. Joe donated $5 to the earthquake relief fund. 

一 bx<Joe donated the earthquake relief fund 和 5 

〈3) a. Joe told the news to Mary。 

一 b. Joe told Mary the news. 

〈4) a、 Joe whispered the news to Mary. 

一 bx Joe whispered Mary the news. 

〈5) a、 Joe baked a cake for Mary- 

一 b. Joe baked Mary a cake. 

〈6) a. Joe iced a cake for Mary。 

一 bx Joe iced Mary a cake. 

47) a。、She threw a cannonball to him， 

一 b. She threw him a cannonball. 

《8) a. She blasted a cannonball to him. 

一 b. x She blasted him a cannonball. 

《9) Sally permitted/allowed/ x let/ xx enabled Bob a kiss。 

《10) Sally refused/denied/ x* prevented/ x disallowedy/ xx 
forbade Bob a kiss. 


从 例 (1) 一 (8) 可 以 看 出 ,同样 是 给 予 义 动词 ,give 可 以 进入 双 宾 名 
式 \` 而 donate 不 行 ; 同 样 是 言说 义 动词 ,tell 可 以 .而 whisper 不 行 ; 
同样 是 制作 (creation) 义 动词 ,bake 可 以 .而 ice 不 行 ; 同 样 是 弹道 运 
动 (ballistic motion) 义 动词 ,threw 可 以 .而 blast 不 行 。 从 例 (9) 和 
《10) 可 以 看 出 ,同样 是 许可 (permission) 义 动 词 ,parmit，allow 可 
以 ,而 let，enable 不 行 ; 同 样 是 拒绝 Crefusal) 义 动词 , refused， deny 
可 以 ,而 prevented，disallow，forbid 不 行 。 汉语 的 情况 也 一 样 , 例 
如 


《11) a. 我 吃 了 弟弟 一 个 革 果 

b. < 我 喷 了 弟弟 一 个 猪手 
c. 关 我 嚼 了 弟弟 一 根 香 其 
d. 关 我 党 了 第 第 一 口 蛋 汤 

〈12) a. 我 穿 过 舅 鼻 一 件 毛 衣 
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~ 国 


. 我 戴 过 舅 身 一 顶 避 子 

. x 我 披 过 努 鼻 一 件 斗 篷 
.我 围 过 血 鼻 一 条 纱 中 

a. 动物 园 飞 了 一 只 网 荐 

bx* 动物 园 距 了 一 只 豹子 

c。 xx 动物 园 蹦 了 一 只 袋鼠 

d. xx 动物 园 跳 了 一 只 猴子 

e.x 动物园 溜 了 一 只 狐狸 

fx 动物 园 走 了 一 只 孔 管 

g. 动物 园 滚 了 一 只 猪 获 

hx 动物园 疏 了 一 只 乌龟 

ix 动物 园 游 了 一 只 和 白 狼 

同样 是 二 价 的 摄食 动词 ,“ 吃 ”可 以 进入 三 价 句 式 ,但 “ 哨 、 嚼 、 尝 "不 
能 ;同样 是 二 价 的 服饰 动词 ,“ 穿 、 戴 ?可 以 进入 三 价 句 式 ,但 “ 披 、 围 ” 
不 能 ;同样 是 一 价 的 移动 动词 “ 飞 ? 可 以 进入 二 价 句 式 , 但 路、 蹦 、 
跳 . 溜 . 走 、 滚 . 疏 . 游 "不 能 。 可 见 , 语 义 上 的 等 价 类 ,不 一 定 是 句法 上 
的 同 分 布 类 。 


避 。 吕 


〈13) 


8 结语 : 走向 统计 方法 和 规则 方法 的 结合 


根据 上 文 的 讨论 ,线性 的 语法 模式 难以 处 理 语言 中 的 峰 套 结构 。 
在 目前 的 技术 条 件 下 ,基于 统计 的 语言 处 理 模型 无 法 通过 对 线性 的 
语言 符号 序列 上 有 限 的 N 个 符号 之 间 共 现 概率 的 统计 ,来 发 现 真 正 
的 语法 结构 .从 而 达到 真正 的 语义 理解 。 对 此 , 黄 昌 宁 、 李 涓 子 
(2002) 有 过 极为 精 到 的 表述 ， 


六 自然 语言 最 重要 的 特征 是 其 结构 性 ,而 N 元 语法 模型 
是 一 种 基于 线性 的 符号 同 现 关 系 的 语言 模型 ,只 能 观察 到 表示 
语言 最 表层 信息 的 符号 (一 般 为 字 、 词 或 词性 标记 ) 之 间 相 邻 出 
现 的 现象 ,并 不 能 观察 语言 的 结构 ,因此 用 线性 的 N 元 语法 模 
型 来 表示 结构 化 的 自然 语言 具有 局 限 性 。 
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0 HMM 等 价 于 概率 型 正规 文法 ,是 一 种 有 限 状 态 模型 ， 
而 有 限 状 态 不 能 描述 自然 语言 的 层级 结构 。( 第 118 一 119 页 ) 
这 倒 使 人 想起 将 近 半 个 世纪 前 ,Chomsky (1957: 16 一 17) 的 断言 : 
一 个 人 说 出 和 理解 符合 语法 的 话语 的 能 力 , 并 不 是 建立 在 
统计 逼近 (statistical approximation ) 之 类 的 概念 基础 上 
的 。，…… 语法 学 是 自 成 一 系 的 (Cautonomous), 是 离开 语义 而 独 
立 的 ;概率 论 模式 (probabilistic models) 无 助 于 人 们 彻底 理解 
句法 结构 上 的 一 些 问 题 。( 中 译本 ,第 10 一 11 页 ) 


随 着 语言 分 析 技 术 和 计算 技术 的 进步 , 乔 氏 的 断言 不 但 没有 成 
为 过 时 的 教条 ,反而 是 不 幸而 言 中 。 这 使 得 我 们 思考 : 语言 信息 处 
理 面临 的 对 象 既 然 有 如 此 顽 劣 的 既 抗 拒 规 则 模型 .又 抗拒 统计 模型 
的 属性 ,那么 一 种 可 能 的 技术 途径 只 能 是 把 规则 的 方法 和 统计 的 方 
法 结合 起 来 ,采用 多 元 化 的 方法 来 建立 处 理 自然 语言 这 种 混杂 (mis- 
cellaneous) 系 统 的 综合 性 模型 。 因 此 ,不 管 是 追求 规则 挖掘 的 语言 
学 家 、 还 是 沉迷 概率 统计 的 计算 语言 学 家 ,对 于 语言 信息 处 理 , 大 家 
面前 都 有 许多 紧迫 的 工作 值得 去 做 。 


鸣谢 : 本 文 承 雇 卫 东 先生 指正 并 提供 有 关 资 料 和 技术 支持 ,说 
此 致 以 诚 雪 的 谢意 。 
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(删节 发 表 于 《语言 文字 应 用 》2004 年 第 2 期 ) 


认 知 科学 和 汉语 计算 语言 委 


本 文 讨论 认 知 科学 跟 汉 语 计算 语言 学 的 关系 。 第 一 部 分 讨论 语言 研 
究 怎 样 以 当代 科技 ,特别 是 以 计算 机 科学 和 技术 为 参照 ,揭示 语言 结构 和 
意义 的 有 关 规 律 ; 第 二 部 分 讨论 智能 系统 和 认 知 科学 的 关系 ,特别 是 认 知 
科学 的 研究 内 容 、 基 本 假设 和 方法 论 特 点 ;第 三 部 分 讨论 认 知 科学 跟 语 言 
学 的 相互 影响 ,特别 是 语言 学 研究 对 认 知 科学 的 贡献 ;第 四 部 分 讨论 认 知 
科学 和 计算 机 理解 自然 语言 研究 的 关系 ,包括 怎样 从 对 语言 的 认 知 研究 
走向 对 语言 的 计算 分 析 , 特 别 讨论 了 基于 认 知 并 面向 计算 的 汉语 语法 研 
究 的 路 线 ; 第 五 部 分 简单 介绍 从 事 语言 学 学 习 和 研究 的 人 怎样 逐步 进 信 
计算 语言 学 研究 领域 。 


1 语言 研究 的 价值 取向 和 评价 参照 


为 什么 要 研究 语言 ? 语言 学 有 什么 用 ? 怎样 来 评价 语言 学 的 研 
究 成 果 及 其 所 达到 的 水 平 ? 这 是 许多 语言 学 家 ,特别 是 初 涉 语言 
的 学 生 爱问 的 问题 。 下 面 就 这 三 个 问题 略 作 讨论 ,作为 本 文 的 一 个 
呈 本 


1.1 语言 学 的 研究 空间 


语言 学 有 两 种 定义 方式 ,一 种 是 传统 的 , 即 语言 学 是 研究 语言 的 
科学 ;一 种 是 现代 的 , 即 语言 学 是 对 语言 的 科学 研究 .@ 这 两 个 定义 
都 涉及 到 “语言 ?和 “科学 ?这 两 个 关键 词 。 但 是 ,语言 的 范围 很 广泛 ， 
从 语音 ,词汇 、` 名 法、 语义 一 直到 语 用 ;科学 研究 的 范式 (paradigmy) 很 
多 ,从 结构 主义 到 后 结构 主义 .从 功能 主义 到 形式 主义 。 可 见 ,语言 
学 的 研究 空间 太 大 。 对 此 ,每 个 研究 者 都 必须 作出 选择 。 而 选择 的 


@ Lyons (1968: 1) 说 : Linguistics may be defined :as the scientific study of lan- 
guage. 
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依据 在 很 大 程度 上 取决 于 研究 者 的 价值 观念 , 即 为 了 什么 而 研究 请 


| 


1.2 面向 当代 科技 的 语言 研究 


在 众多 的 语言 学 追求 中 ,我 们 倡导 一 种 面向 当代 科技 的 语言 
究 ,强调 语言 研究 的 当代 性 和 应 用 性 。 具 体 地 说 ,包括 下 面 两 层 意 
思 : (1) 语言 研究 为 当代 科学 技术 服务 ,使 语言 学 的 研究 成 果 更 具 
有 科学 的 认识 价值 和 实际 的 应 用 价值 。 比 如 ,对 于 人 类 自身 智能 的 
认识 ,可 以 从 语言 角度 切入 ,从 而 开拓 新 的 思路 : 模拟 大 脑 的 活动 而 
发 展 新 的 计算 机 原理 、 新 的 计算 方法 和 软件 技术 。 对 语言 结构 的 精 
细 的 描写 和 形式 化 处 理 , 可 以 为 计算 机 处 理 自然 语言 提供 可 靠 的 基 
础 ,从 而 开辟 语言 信息 处 理 产业 这 一 新 的 市 场 。 

(2) 用 当代 科学 技术 的 新 观念 来 冲击 、 刷 新 语言 学 的 理论 和 方 
法 。 比 如 ,Chomsky 的 生成 语法 就 是 在 上 个 世纪 50 年 代 的 计算 机 
科学 技术 、 认 知 科 学 、 数 理 逻 辑 、 信 息 论 等 当时 最 新 的 科学 技术 的 表 
景 上 产生 的 。 同 时 , 反 过 来 又 对 当时 的 科学 技术 ,比如 理论 计算 机 科 
学 (特别 是 形式 语言 的 层级 体系 , 即 Chomsky Hierarchy),* 起 了 促进 
作用 。 


1.3 语言 研究 的 计算 机 参照 


怎样 来 评价 一 个 时 代 的 语言 研究 的 成 就 和 所 达到 的 水 平 呢 ? 白 
硕 (1996) 认 为 : 评价 语言 学 知识 需要 参照 物 作 为 “ 硬 ” 的 检验 。 比 
如 ,传统 语言 学 以 本 族 说 话 人 为 参照 物 , 以 满足 本 族 语言 教学 的 需要 
为 目的 。 因 此 ,所 获得 的 语言 知识 在 今天 看 来 不 完善 和 过 于 简化 ， 
描写 语言 学 以 非 本 族 说 话 人 为 参照 物 , 以 满足 外 语 教学 和 对 蜡 文 化 
的 了 解 为 目的 (比如 ,上 世纪 初 人 类 学 家 对 各 种 印第安 语言 的 记录 和 
描写 ) 。 许 多 本 族人 习以为常 的 现象 被 挖掘 出 来 了 ,语言 学 知识 从 量 
到 质 都 有 了 明显 的 提高 。 后 来 ,出 现 了 计算 机 和 计算 机 理解 自然 语 
言 , 于 是 ,计算 机 成 了 语言 学 知识 的 一 个 新 的 参照 物 。 因 为 计算 机 只 
能 处 理 形 式 化 的 知识 ,所 以 要 想 让 计算 机 处 理 自然 语言 ,就 必须 把 语 
言 学 知识 形式 化 。 正 是 在 把 语言 学 知识 形式 化 的 过 程 中 ,人 们 认识 
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到 了 一 些 没 有 计算 机 作 参 照 就 很 难 揭示 出 来 的 现象 和 规律 。 现在 ， 
网 络 将 成 为 语言 学 知识 的 一 个 新 的 参照 物 。 因 为 在 网 上 传输 的 信息 
很 大 一 部 分 是 自然 语言 ,所 以 语言 学 必然 要 在 网 络 信息 处 理 中 扮演 
重要 的 角色 。 比 如 ,网 络 信息 的 文本 分 类 ,快速 检索 、 信 息 抽取 、 信 息 
过 滤 等 ,都 需要 语言 学 知识 作 支 持 。. 

这 样 ,语言 研究 就 不 仅 具 备 自然 科学 的 探索 .认识 功能 ,而 且 还 
具备 技术 科学 的 社会 功能 一 一 利用 对 语言 的 科学 认识 来 造福 于 人 
类 。 


2 智能 系统 和 认 知 科学 


语言 是 人 类 智能 的 重要 的 组 成 部 分 ,而 新 兴 的 认 知 科学 以 研究 
智能 系统 为 已 任 。 因 此 , 认 知 科学 势必 会 对 语言 学 产生 积极 的 影响 ， 
并 为 语言 学 的 科学 化 和 现代 化 提供 机 会 。 为 此 ,下 面 对 认 知 科学 中 
若干 重要 的 方面 略 作 介绍 。 


2.1 心 脑 的 二 元 对 立 和 认 知 中 介 理 论 


众所周知 ,人 是 一 种 有 心智 的 动物 。 所 谓 心 智 (mind) 泛 指 人 的 
知觉 ,注意 记忆、 学 习 ,. 思 维 、 理 解 、. 创 新 等 各 种 心理 活动 , 它 跟 大 脑 
(prain) 相 对 。 在 人 类 的 心智 中 , 像 判 断 、 推 理 和 想象 等 利用 知识 去 
解决 问题 的 心理 能 力 被 称 为 智能 (intelligeneey。 智 能 也 可 以 定义 为 
在 新 情况 下 作出 恰当 的 反应 的 能 力 ,因为 要 在 新 的 情况 下 作出 恰当 
的 反应 ,必然 要 利用 知识 来 进行 判断 、 推 理 和 想象 。 至 于 大 脑 则 是 心 
智 的 器 官 ,大 脑 的 活动 ( 即 脑 过 程 ) 其 结果 产生 了 心智 。 脑 过 程 表现 
为 大 脑 中 的 神经 元 Cneuron) 之 间 传 递 信息 的 生物 电学 和 化 学 过 
程 。 

问题 是 : 如 何 用 大 脑 中 的 神经 元 的 活动 这 种 低层 次 的 生理 现象 
去 说 明 .解释 心智 这 种 高 层次 的 心理 现象 。 为 了 填补 这 种 心 脑 二 元 
之 间 的 鸿沟 ,功能 主义 者 假设 在 人 的 大 脑 和 心智 之 间 存 在 着 一 个 认 


@ 笔者 在 引述 时 作 了 补充 和 发 挥 , 如 有 差错 ,责任 在 我 。 
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知 平面 ,在 这 个 抽象 的 理论 平面 上 ,我们 可 以 撤 开 脑 过 程 这 种 具体 的 
生化 现象 来 谈论 大 脑 是 怎样 工作 的 。 可 见 , 认 知 (cognition) 是 功能 
主义 者 对 人 类 智能 在 大 脑 中 的 组 织 方式 和 工作 原理 的 一 种 理论 概 
括 , 它 包 括 认 知 结构 (意象 Cimagery]、 图 式 Cscheme] 范畴、 原型 、 命 
题 .脚本 、 网 络 等 ) 和 认 知 过 程 ( 如 记忆 、 编 码 、 搜 索 `. 思 维 、 概 念 形成 、 
扩散 性 激活 、 缺 省 推理 、 隐 喻 投射 .语言 理解 等 ) 两 个 方面 。 


2.2 ”什么 是 认 知 (活动 )? 


认 知 有 时 指认 知 活动 ,在 这 一 意义 上 , 认 知 指 人 用 知识 去 解决 复 
杂 问 题 的 心理 过 程 .@ 认 知 活动 一 般 不 包括 像 感觉 、 知 党 等 低层 次 
的 心理 活动 。 比 如 ,对 光 点 的 感觉 .图 形 知觉 的 形成 ,一 般 来 说 不 属 
于 认 知 活动 ,因为 它 并 不 利用 知识 。 但 是 , 当 人 们 把 北极 星 周围 的 一 
群星 看 作 一 只 小 能 (命名 为 小 能 星座 ), 把 其 附近 的 另 一 群星 看 作 一 
只 大 能 (命名 为 大 能 星座 ) ,并 把 大 能 星座 的 七 颗 明 亮 的 分 布 成 义 形 
的 星 看 作 盛 酒 的 斗 (命名 为 北斗 星 ); 那 就 属于 认 知 活动 ,因为 这 是 一 
种 基于 知识 的 隐喻 投射 一 一 把 人 们 生活 中 熟悉 的 概念 投射 到 陌生 的 
事物 上 。 认 知 活动 通常 指 高 层次 的 心理 活动 ,如 问题 求解 (problem 
resolution) , 像 求解 代数 方程 式 等 活动 。 比 如 ,已 知 方程 式 : 8x 十 5 
一 4x 十 17， 求 解 x 一 ? 

要 求解 出 x 的 值 ,必须 对 给 定 的 方程 式 进行 变换 ,最 后 得 到 x 一 
… 这 样 的 形式 。 在 这 过 程 中 ,必须 遵循 这 样 的 等 价 变换 规则 (rule) : 
在 方程 式 的 等 号 两 边 同 时 加 、 减 、. 乘 、 除 相同 的 数 ,等 式 不 变 。 其 实 ， 
规则 只 是 一 种 约束 条 件 , 人 们 还 必须 使 用 策略 (strategy) 来 作 宏观 的 
指导 ,以 明确 什么 时 候 、 什 么 情况 下 使 用 什么 规则 ` 进 行 什么 操作 。 
在 问题 求解 过 程 中 ,最 常用 和 有 效 的 策略 是 “手段 一 目的 "分析 法 
(mean-end analysis) 。 比如 ,在 解 上 列 方程 时 ,为 了 达到 求 得 x 一 … 
这 样 的 目的 ,得 设法 消去 等 式 右 侧 的 4x 和 等 式 左 侧 的 常数 5 和 系数 
8。 于 是 ,在 等 式 两 边 同 时 减 去 4x, 减 去 5, 再 除 以 8, 就 得 到 了 x 一 3。 
事实 上 ,人 们 已 经 把 这 种 策略 和 规则 结合 在 一 起 ,总 结 成 程式 化 的 口 


@ 8 2.2 一 2.6 参考 李 家 治 (1985) 等 文献 ,不 一 一 具 指 。 
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诀 : 移 项 合并 同类 项 。 

虽然 ,这 种 问题 求解 是 一 种 非常 复杂 的 认 知 活动 ;但 是 ,通过 分 
析 其 过 程 及 其 所 使 用 的 策略 和 规则 ,可 以 写 出 极其 机 械 的 形式 化 的 
解 题 方法 , 即 算法 (algorithm) 。 比 如 : 


证 “X 王 N” 一 Hold & check; N: number ( 数 ) 
这 N on left 一 SCN); S: subtract ( 减 ) 
证 Nx on right -一 SCNX) ; 

证 Nx on left，N 天 1 一 DIN). D: divide( 除 ) 


如 果 用 某 种 程序 语言 来 把 上 述 算法 编 成 程序 ,那么 就 可 以 在 计 
算 机 上 和 运转, 即 进行 自动 解 方程 。 这 个 例子 说 明 , 对 人 类 的 心理 活动 
的 认 知 研究 ,最终 可 以 导向 一 种 非常 严格 的 计算 分 析 。 或 者 说 , 认 知 
的 本 质 是 计算 ,表现 为 一 系列 受 约束 的 变换 操作 ;其 中 的 每 一 步 都 是 
由 目标 制导 的 (goal-directed) ,并 且 是 受 规则 约束 的 (rule-constrain- 
ed)。 这 一 点 ,下 一 节 还 要 讨论 到 。 


2.3 什么 是 认 知 科学 ? 


简单 地 说 , 认 知 科学 (cognitive science) 是 研究 心智 的 科学 ; 具 
体 地 说 , 认 知 科学 是 一 门 研究 智能 系统 (包括 天 然 的 和 人 工 的 ) 的 内 
部 结构 、 功 能 和 工作 原理 的 科学 。 这 里 ,天 然 的 智能 系统 指 人 的 大 
脑 , 人 工 的 智能 系统 指 计算 机 。 认 知 科学 是 一 门 新 兴 的 前 沿 性 学 科 ， 
它 是 在 哲学 ,心理 学 .语言 学 .计算 机 科学 和 神经 生理 学 等 多 个 学 科 
的 交叉 领域 中 发 展 起 来 的 。 

认 知 科学 用 信息 加 工 (information processing) 的 观点 来 研究 认 
知 结构 和 认 知 过 程 , 比 如 ,把 记忆 比 作 计 算 机 的 存储 器 、 把 思维 比 作 
信息 加 工 ( 即 对 符号 串 进 行 受 约束 的 变换 ) 等 。 像 HSimon 和 A. 
Newell 还 提出 了 著名 的 物理 符号 系统 假设 (hypothesis of physical 
symbolic system) : 智能 的 基础 是 符号 操作 ,通过 符号 的 产生 、 排 列 
和 组 合 , 智 能 系统 就 能 将 外 部 的 事件 内 化 为 内 部 的 符号 事件 并 加 以 
控制 ,从 而 表现 出 智能 来 。 因 此 ,一 切 认 知 系统 (不 管 是 天 然 的 人 脑 
还 是 人 工 的 电脑 ?的 本 质 都 是 符号 加 工 系统 。 而 符号 操作 的 实质 就 
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是 计算 (computation) ,表现 为 具有 特定 语义 解释 的 符号 表达 式 的 各 
种 受 规则 约束 的 变换 。 比 如 ,人 的 心智 表达 就 是 一 种 形式 化 的 符号 
表达 式 ,是 跟 系 统 的 物理 状态 ( 即 神经 元 的 某 种 运动 方式 ) 相 对 应 的 
某 些 基 本 要 素 的 离散 的 排列 。 所 有 跟 系统 有 关 的 语义 内 容 都 依靠 深 
层 的 符号 表达 式 及 其 变换 形式 和 符号 关系 结构 来 规定 。 显 然 , 这 是 
一 种 语义 上 中 断 的 物理 符号 操作 ,因而 是 一 种 计算 。 因 此 ， 认 知 就 
是 计算 ?是 经 典 的 认 知 科学 的 一 个 信条 。 


2.4 认 知 科学 的 历史 背景 


人 类 的 智能 问题 一 直 是 哲学 家 关心 的 话题 ,从 柏拉图 到 笛 卡 儿 
等 伟大 的 哲学 家 对 此 都 有 过 精辟 的 论述 。 但 是 ,直到 计算 机 出 现 , 并 
且 涉 及 到 计算 机 模拟 人 类 智能 问题 时 , 认 知 科学 这 个 学 科 及 其 特有 
的 性 质 才 得 以 确立 。 

1956 年 在 MIT 召开 了 关于 通讯 和 信息 论 的 学 术 会 议 ,心理 学 
家 Miller 提交 了 关于 短 时 记忆 的 容量 的 论文 ,心理 学 家 Bruner 提交 
了 关于 思维 研究 的 论文 ,语言 学 家 Chomsky 提交 了 关于 语法 的 形式 
特性 的 论文 ,计算 机 科学 家 A. Newell 心理 学 家 HH. Simon 提交 了 
关于 “有 辑 理论 家 ”的 论文 ( 旨 在 使 计算 机 可 以 使 用 启发 式 (heuris- 
tic) 程 序 像 人 一 样 解决 问题 )。 这 种 对 智能 系统 的 多 学 科 的 合作 和 
交流 ,使 得 认 知 科学 初 具 雏形 。 同 年 ,计算 机 科学 家 M. Minsky、\J. 
MEcCarthy、A， Newell 和 心理 学 家 了 .Simon 等 聚首 普 利 茅 茨 学 院 ， 
探讨 一 些 计算 机 科学 技术 方面 的 问题 。 他 们 特别 讨论 到 了 用 计算 机 
来 模拟 人 类 智能 的 问题 , McCarthy 还 专门 造 了 artificial intelligence 
(人 工 智 能 ) 这 一 名 词 。 用 计算 机 模拟 人 类 智能 的 思想 又 推动 了 认 知 
科学 的 产生 。 

1975 年 Chomsky 和 心理 学 家 JJ Piaget 关于 人 类 智能 的 来 源 当 
面 进 行 辩 论 .0 心理 学 家 Gardner 对 此 事 评 论 时 宣称 Cognition 
comes of age( 认 知 的 时 代 到 来 了 ) 。1977 年 Cogrztiue Sciezce( 认 知 
科学 ) 杂 志 创 刊 ,成 立 认 知 科学 学 会 ,并 以 该 杂志 为 会 刊 ;1979 年 召 


@ 详细 的 情况 ,请 看 Piattelli-Palmarini (1980) 〈ed. ) 。 
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开 认 知 科学 学 会 的 第 一 次 正式 的 年 会 ,这 都 标志 着 认 知 科学 的 诞生 。 
2.5 认 知 科学 的 研究 内 容 和 核心 假设 


认 知 科学 的 特点 是 : 范围 广泛 .核心 明确 .层级 清晰 。 凡是 跟 心 
智 有 关 的 问题 ,从 神经 基础 到 社会 文化 因素 ,从 哲学 思辨 到 计算 机 程 
序 实 现 ,都 是 认 知 科学 家 所 津津 乐 道 的 。 他 们 经 常 讨 论 的 问题 有 ; 
《1) 复杂 行为 的 神经 生理 基础 .遗传 因 素 ;(2) 问题 求解 和 推理 过 
程 ;(3) 符号 系统 ,包括 自然 语言 语音、 图 像 、 数 字 、 视 觉 映 象 等; (四 
知觉 的 呈现 (presentation) 和 符号 表征 (representation) 问 题 ;(5) 记 
忆 模 型 ,如 工作 记忆 、 短 时 记忆 、 中 期 记忆 、 长 时 记忆 等 ;(6) 关 识 表 
泵 理论, 如 心理 表象 ( 即 意象 )、 图 式 、 范 畸 、 原 型 命题 框架 ,脚本 .网 
络 等 ;7) 自然 语言 的 理解 和 生成 ;(8) 学 习 的 模型 ,涉及 问题 的 表 
示 、 解 题 的 条 件 和 动作 等 ;(9) 目的 、 情 绪 、 动 机 对 认 知 的 影响 ;510) 
社会 文化 背景 对 认 知 的 影响 。 

这 样 ,构成 了 认 知 科学 的 如 下 这 种 以 认 知 平面 为 核心 的 研究 层 


次 : 
| 大 脑 神经 系统 


认 知 平面 


心理 、 精神 、 思 维 


外 显 行为 


文化 、 历 史 


至 于 为 什么 要 研究 这 些 内 容 以 及 怎样 来 研究 这 些 纷繁 的 问题 ， 
认 知 科学 基于 如 下 两 个 重要 的 核心 假设 ， 

41) 存在 着 认 知 这 一 独立 的 心理 表示 平面 。 认 知 科学 认为 人 类 
的 认 知 活动 必须 用 符号 、 图 式 (schemes)、 表 象 (imagery) 、 观 念 
4idea7 和 其 他 心理 表示 形式 来 加 以 描述 。 在 这 样 的 表示 平面 上 进行 
研究 时 ,科学 家 处 理 的 是 像 符号 、 规 则 、 表 象 之 类 用 以 表示 事物 的 实 
体 ,这 种 实体 是 处 于 输入 和 输出 之 间 的 表示 材料 ; 据 此 ,可 以 探索 连 
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接 .转换 或 比较 这 些 表示 实体 的 方式 。 为 了 解释 各 种 各 样 的 人 类 行 
为 、 动 作 和 思维 ,这 种 水 平 是 十 分 必要 的 。 

(2) 可 以 把 计算 机 作为 人 类 思维 的 模型 。 如 果 说 计算 机 有 转 
换 、 处 理 信息 .进行 推理 改变 行为 的 能 力 ,那么 可 以 用 同样 的 方式 来 
刻画 人 类 的 思维 特征 ,也 完全 可 以 用 计算 机 来 模拟 人 类 的 认 知 过 程 。 
这 就 是 2. 3 中 提 到 的 物理 符号 系统 假设 。 


2.6， 认 知 科学 的 学 科 性 质 、 研 究 策略 .方法 论 特 点 


从 学 科 性 质 上 看 , 认 知 科学 是 一 门 新 兴 的 交叉 科学 , 它 跨 接 心理 
学 . 脑 神 经 科学 .计算 机 科学 和 语言 学 等 多 种 学 科 。 虽 然 认 知 科学 的 
各 种 来 源 学 科 有 共同 的 目标 : 发 现 心智 的 表示 和 计算 能 力 及 其 在 人 
脑 结构 和 功能 上 的 表现 ,并 在 计算 机 上 模拟 验证 。 但 是 , 认 知 科学 没 
有 形成 公认 统一 的 研究 范式 , 即 没有 一 致 的 假设 和 方法 。 所 以 ,从 事 
不 同学 科 领 域 的 认 知 科 学 家 倾向 于 把 自己 喜爱 的 范式 加 之 于 整个 令 
域 ,并 希望 把 认 知 科学 理解 成 符合 他 们 各 自 对 于 该 领域 的 尝试 性 解 
释 。 

从 研究 策略 上 看 , 认 知 科学 持 有 跨 学 科 的 信念 , 寄 希 望 于 不 同学 
科 的 合作 和 相互 影响 。 认 知 科学 的 许多 问题 植 根 于 古典 的 哲学 问 
题 ,比如 ,思维 .意识 \ 心 脑 关 系 等 都 成 为 认 知 研究 的 起 点 。 认 知 科学 
在 研究 取向 上 不 偏重 于 情感 . 语 境 、 文 化 和 历史 ,虽然 它们 对 动作 ` 思 
维 有 影响 ,但 还 是 要 尽 可 能 地 排除 它们 。 

在 方法 论 上 , 认 知 科学 综合 了 实验 心理 学 和 人 工 智能 的 方法 论 ， 
既 重视 实验 又 重视 程序 技术 。 因 此 , 认 知 科学 对 大 脑 功能 的 研究 超 
越 了 以 往 的 哲学 式 的 思辨, 成 为 一 门 建立 在 严格 的 实验 基础 上 的 经 
验 性 的 科学 。 


3 ” 认 知 科学 和 语言 学 的 相互 影响 
认 知 科学 无 疑 将 为 语言 学 提供 新 的 研究 范式 ,同时 ,语言 学 也 将 


为 认 知 科学 提供 广泛 而 系统 的 素材 和 虽然 不 甚 严格 但 确实 是 富有 洞 
察 力 的 方法 。 
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3.1 认 知 科学 对 语言 研究 的 影响 


认 知 科学 可 以 帮助 我 们 形成 新 的 语言 观 和 方法 论 。 我 们 应 该 把 
语言 学 置 于 认 知 科学 的 洪流 中 ,使 之 成 为 更 为 广阔 的 探索 人 类 心智 
的 伟大 事业 的 一 部 分 。 这 样 ,可 以 扩大 语言 学 家 的 眼界 ,帮助 我 们 形 
成 新 的 语言 观 和 方法 论 。 从 认 知 的 角度 看 ,语言 是 人 类 普遍 的 认 知 
组 织 的 一 个 组 成 部 分 , 它 既 是 认 知 的 工具 和 手段 ,又 是 认 知 的 结果 。 
同时 , 认 知 科学 的 设计 实验 的 方法 、 建 立 模型 的 方法 、 假 设 抽象 的 心 
理 表 示 平 面 的 方法 .用 计算 机 进行 模拟 和 验证 的 方法 ,都 对 语言 研究 
的 方法 论 革 新 具有 特别 重要 的 启迪 作用 。 

认 知 科学 可 以 帮助 我 们 从 人 类 认 知 的 角度 去 理解 .评价 形式 语 
法 和 功能 语法 的 各 种 理论 模型 ,特别 是 其 中 的 语言 知识 的 表示 平面 
和 形式 化 的 表示 方法 ,检验 这 些 理论 模型 中 的 有 关 概 念 、 规 则 、 假 设 
等 的 心理 现实 性 ,从 而 促使 我 们 去 建立 更 加 有 效 的 语言 学 模型 。 

认 知 科学 还 可 以 推动 语言 学 跻身 于 当代 前 沿 科学 。 正 如 周 光 召 
(1995) 所 言 :“ 人 的 思维 和 意识 是 如 何 由 人 脑 产 生 的 ”能 不 能 用 计算 
机 加 以 模拟 ?这 是 最 基本 的 科学 问题 之 一 。 人 的 大 脑 是 自然 过 程 中 
最 伟大 的 杰作 ,彻底 地 揭 开 大 脑 的 奥秘 是 自然 科学 面临 的 最 大 挑战 。 
0 大 脑 在 逻辑 运算 上 虽 不 如 一 台 高 速 运行 的 计算 机 ,但 图 形 识别 
和 直觉 判断 的 能 力 则 远 远 高 于 一 台 超 级 计算 机 。 这 一 矛盾 暗示 我 
们 : 人 脑 的 工作 原理 不 同 于 目前 计算 机 的 结构 和 运算 方式 , 它 除 了 
逻辑 思维 、 抽 象 思 维 以 外 ,还 有 形象 思维 。…… 因此 ,探索 人 脑 的 认 
知 过 程 和 模式 ,对 创造 性 地 发 展 计算 机 科学 ,是 一 项 必要 的 选择 。 认 
知 科学 是 在 神经 科学 ,心理 学 .科学 语言 学 .计算 机 科学 乃至 哲学 的 
交界 面 上 发 展 起 来 的 , 它 以 人 类 的 智能 和 认 知 活动 为 研究 对 象 .” 于 
是 ,作为 认 知 科学 的 一 个 组 成 部 分 的 语言 学 , 必 将 在 认 知 科学 的 要 求 
和 带动 下 ,不 断 地 完善 自己 ;并 且 , 随 着 认 知 科学 一 起 跻身 于 当代 前 
沿 科学 之 林 。 


3.2 语言 学 对 认 知 科学 的 贡献 
语言 是 人 类 智能 的 一 个 重要 的 组 成 部 分 ,语言 能 力 是 人 类 最 基 


90 基于 认 知 的 汉语 计算 语言 学 研究 


本 的 认 知 能 力 。 因此 ,语言 是 洞察 人 类 心智 的 一 个 窗口 ,研究 语言 在 
一 定 程度 上 就 是 在 研究 心智 。 比如 , 认 知 科学 惯 于 从 人 类 显现 的 行 
为 来 推断 有 机 体 的 心智 能 力 , 再 从 心智 能 力 来 推断 有 机 体 的 某 些 性 
质 。 于 是 ,通过 观察 人 类 的 语言 行为 , 便 可 以 推断 人 类 的 语言 能 力 ; 
再 由 此 推断 人 类 的 某 些 心 智 特 征 ( 比 如 递归 性 能 力 ,等 等 )， 从 儿童 
语言 获得 (language acquisition) 的 如 下 两 个 事实 : 速度 快 、 输 入 极其 
不 完善 ,可 以 得 出 人 类 有 天 生 的 语言 能 力 〈linguistic competence) 这 
一 假设 ;再 由 此 可 以 推出 人 类 大 脑 的 有 关机 制 。 加 上 语言 研究 的 历 
史 长 ,成果 多 、 结 论 又 相对 一 致 ,2 这 特别 有 利于 语言 学 成 为 认 知 科 
学 的 一 个 核心 的 组 成 部 分 。 

另外 ,语言 最 有 系统 性 ,也 最 便于 观察 。 于 是 ,我 们 可 以 通过 分 
析 其 输入 和 输出 关系 ,来 假设 介 于 输入 和 输出 两 端 之 间 的 人 脑 的 工 
作 机 制 , 从 而 对 人 脑 的 语言 处 理 机 制作 出 认 知 假设 。 特 别 是 , 认 知 研 
究 在 很 大 程度 上 是 一 种 理论 假设 , 即 所 谓 的 黑箱 模型 (black box 
model); 这 跟 神 经 生理 学 的 解剖 实验 和 实证 研究 尚 有 很 大 的 鸿沟 。 
但 是 ,通过 对 语言 研究 ,特别 是 对 失语 症 病人 的 语言 缺损 情况 跟 大 脑 
损伤 部 位 的 关联 性 研究 ,在 一 定 程 度 上 可 以 把 高 层次 的 认 知 研 究 跟 
低层 次 的 神经 研究 沟通 和 关联 起 来 ;从 而 ,使 认 知 科学 的 理论 假设 能 
够 建立 在 神经 科学 的 实证 基础 上 。 为 此 ,下 面 专门 介绍 关于 语言 结 
构 中 的 空 语 类 (empty category) 的 心理 实验 及 其 跟 大 脑 损 伤 部 位 的 
关系 的 有 关 实 验 。.@ 
3.2.1 语言 结构 中 的 空 语 类 及 其 心理 现实 性 

大 家 知道 ,一 个 句子 的 意思 并 不 是 这 个 句子 中 的 词语 的 意思 的 
简单 的 堆砌 ;除了 词语 之 外 ,还 有 结构 要 素 在 其 中 起 作用 。 看 得 见 的 
结构 要 素 包 括 语序 (word-order) \ 形 态 变化 (inflection) 和 虚词 (func- 
tion word) 等 ,看 不 见 的 如 结构 层次 (Cstructural hierarchy) 和 结构 关 
系 (structural relation) 等 。 例 如 : 


《1) a.I know whoi Josephine thinks [ei] is clever. 


@ 参考 Halle (1973) 。 
@ 下 面 的 介绍 详 见 Fodor (1995) 。 
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b.，I know whomi Josephine ought to consult [ei 计 . 
〈2) a。Which booksi did John read [e] in the bathtub? 
b. Do you recall which books; John proclaimed [ei] 


were unreadable? 


从 例 C1) 可 以 看 出 ,关系 代词 的 形态 格 (主格 还 是 宾 格 ) 的 确定 取决 于 
其 在 底层 结构 (underlying structure) 中 的 位 置 。 从 例 (2) 可 以 看 出 ， 
虽然 疑问 短语 (Wh-phrase) 都 处 于 从 句 的 句 首位 置 ,但 是 由 于 其 论 
旨 角 色 (thematic role) 不 同 ,因而 在 句子 的 语义 解释 中 的 地 位 不 同 。 
像 这 种 细微 的 差别 ,只 能 从 其 潜在 的 底层 位 置 Cunderlying position) 
上 去 推 求 和 解释 。 于 是 ,从 理论 上 ,或 者 说 从 认 知 上 ,可 以 假定 其 原 
来 的 位 置 上 还 留 下 一 个 语 迹 (trace), 即 空 语 类 (可 以 用 。 来 代表 ) 。 
语 迹 虽 然 没 有 语音 形式 ,但 是 具有 句法 作用 ; 它 约 束 前 移 的 疑问 得 
语 ,并 在 语义 上 跟 这 个 前 移 的 成 分 ( 即 先行 成 分 ) 同 指 (Cco- 
reference) 。 作 为 约定 ,可 以 用 下 标 来 标注 它 跟 其 先行 成 分 的 同 指 关 
系 。 

问题 是 ,这 种 认 知 假设 有 没有 心理 现实 性 (psychological real- 
ity)? 这 只 有 通过 心理 实验 来 检验 。 下 面 ,介绍 三 个 这 方面 的 心理 

实验 一 : 自 定时 间 的 阅读 方式 (self-paced reading paradigm) 。 
例如 : 

(3) a。， Whati did the cautious old man whisper [ei] to his 
fiancee during the movie last night? 


b，、Whati did the cautious old man whisper to his fiancee 


about [eij] during the movie last night? 


被 试 按 一 下 按钮 ,屏幕 上 出 现 一 个 词 ; 被 试 觉得 自己 理解 以 后 ， 再 按 
一 下 按钮 ,申请 下 一 个 词 。 时 间 长 短 不 限 , 但 都 进入 统计 。 结 果 , 理 
解 (3a) 中 的 to his fiancee during the movie last night 快 于 (3b) 中 的 
to his fiancke about [ei] during the movie last night。 因 为 whisper 
有 及 物 ( 如 John whisper a 和 his friend) 和 不 及 物 ( 如 John 
whisper to his friend ,或 者 John whisper about the message) 两 种 用 
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法 ,所 以 当 被 试 读 到 (3b) 的 whisper 时 ,以 为 那儿 跟 (3a) 一 样 有 一 个 
空 语 类 ;后 来 读 到 后 面 的 词语 才 知 道 空 语 类 原来 在 about 之 后 。 正 
是 这 种 错误 的 插入 空 语 类 以 及 后 来 的 修正 ,多 花 了 语义 理解 的 时 间 。 
这 说 明 人 在 处 理 句子 时 ,不 仅 能 识别 空 语 类 的 位 置 ,而 且 有 急于 找 出 
跟前 移 成 分 相关 的 语 迹 的 心理 倾向 。 

实验 二 : 视觉 探测 识别 (visual probe recognition) 。 例 如 : 


(4) a。 The terrorists wanted to disrupt the ceremonies. 
b。[The new mayor at the center podium ji was shot 
[Lei]. 

(5) a。 The terrorists wanted to disrupt the cereInonies. 


b，The new mayor at the center podium was furious. 


在 屏幕 上 显示 上 面 的 句子 b 及 其 背景 句 a, 然 后 消失 ;再 显示 mayor 
等 探测 词 ,要 求 判 断 它 是 否 在 前 面 的 句子 中 出 现 。 结果 ,正确 判断 
(4 类 句子 的 时 间 短 于 (5) 类 句子 。 一 种 可 能 的 解释 是 , 句 尾 的 空 语 
类 跟前 面 的 先行 词 同 指 , 被 激活 (activate) 的 先行 词 有 助 于 对 探测 词 
的 判定 。 

实验 三 : 听觉 -视觉 交叉 模式 启动 (cross-modal priming)。 例 
如 : 


(6) The policeman saw the boyi[Lthati the crowd at party 


accused [ei] of the crime]. 


让 被 试听 上 面 的 句子 ,到 空 语 类 处 [ei] 在 屏幕 上 显示 girl 等 ( 跟 boy 
相关 ) 词 ,让 被 试 大 声 读 出 。 计 算 从 显示 到 读 出 所 花 的 时 间 。 也 显示 
officer( 跟 policeman 相关 )、people( 跟 crowd 相关 )， 以 及 其 他 无 关 
的 词 作 为 对 照 。 结 果 , 只 有 在 [e] 处 且 跟 boy 相关 的 词 反应 时 间 最 
短 。 这 也 说 明了 空 语 类 的 存在 ,并 在 句子 的 语义 解释 中 起 作用 。 
3.2.2 处理 空 语 类 的 神经 基础 

上 面 只 是 在 比较 抽象 的 心理 学 层面 上 ,证 明 空 语 类 具有 心理 现 
实 性 。 现 在 的 问题 是 ,人 类 处 理 空 语 类 的 神经 基础 是 什么 ? 由 于 不 
能 解剖 正 常人 的 大 脑 等 伦理 限制 ,只 能 从 失语 症 患 者 的 语言 表现 那 
儿 间 接地 寻找 答案 。 
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失语 症 (aphasia) 指 大 脑 一 定 区 域 发 生 器 质 性 病变 而 造成 的 言 
语 缺 失 , 即 语言 表达 或 理解 上 的 障碍 。 其 中 ， 比较 典型 的 有 两 种 : 
(1) 布 洛 卡 失语 症 (Brocays aphasia) ,表现 为 理解 相对 正常 ,说 话 不 
流畅 .话语 不 合 语法 。 其 损伤 部 位 是 额 下 回 ,位 于 大 脑 左前 叶 。(2) 
韦 尔 尼克 失语 症 (Wernickeys aphasia) ,表现 为 说 话 流畅 .话语 基本 
合乎 语法 ,但 理解 显然 无 能 。 其 损伤 部 位 是 材 平 面 ,位 于 左 半 脑 的 后 
部 。 布 洛 卡 失语 症 患 者 的 语法 能 力 缺 损 , 所 以 说 话 (造句 ) 困难 ; 但 
是 ,他 们 的 话语 理解 还 可 以 。 这 就 引出 一 个 问题 ， 难道 语言 理解 不 
需要 语法 ? 为 了 比较 确切 地 了 解 这 一 点 ,就 需要 下 列 实 验 来 证 明 。 

实验 一 : 句子 一 图 片 匹配 测试 《sentence-picture matching 
test) 。 例 如 : 


〈1) a.， It was the girli whoi[ei chased the boy |. 
b. It was the boyi whomi[the girl chased ei ]. 


上 面 的 a 是 主语 分 裂 结构 (subject-cleft construction) "5 是 宣 语 分 裂 
结构 (object-cleft construction ) 。 在 被 试 ( 布 洛 卡 失语 症 患 者 ) 听 了 
句子 后 ,让 他 们 选择 相应 的 图 片 。 对 于 (la) 他 们 能 做 得 很 好 ,说 明 他 
们 能 很 好 地 理解 这 种 句子 ;但 对 于 (1b) 则 做 得 很 糟 , 说 明 他 们 不 能 
理解 这 种 句子 。 为 什么 ? 原来 ,在 处 理 (la) 这 种 句子 时 ,他 们 利用 了 
默认 施 事 在 前 的 策略 (agent-first default strategy)。 他 们 用 这 种 非 
语言 的 认 知 策略 来 作 猜 测 ,并 且 还 每 每 得 手 。 碰 到 (1b) 这 种 句子 ， 
那 种 策略 就 失效 了 ;因为 ,理解 这 种 句子 必须 利用 空 语 类 跟 其 先行 语 
的 照应 关系 这 种 句法 知识 ,但 是 布 洛 卡 失语 症 患者 的 句法 知识 受 损 ， 
就 无 法 利用 这 种 知识 。 据 此 ,可 以 断定 : 该 损伤 部 位 是 处 理 空 语 类 
等 句法 问题 的 神经 基础 。 同 时 ,这 个 实验 还 说 明 ， 布 氏 患者 对 于 关 
系 代 词 提 供 的 形态 格 ( 如 例 la，b 中 的 主格 、 宾 格 等 ) 也 不 能 利用 。 

在 视觉 探测 识别 实验 中 , 韦 尔 尼克 失语 症 患者 能 作出 正确 的 判 
断 , 但 布 氏 患 者 却 不 能 。 于 是 ,改作 下 列 实验 再 行 试验 。 

实验 二 : 听 党 一 视觉 交叉 模式 词汇 启动 (cross-modal lexical 
priming。 例 如 : 


(2) The man liked the tailori with the British accent who 
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[Fei] claimed to know the dueen. 


这 是 一 个 主语 关系 从 名 结构 (subjectrrelative construction) 。 在 耳 
机 上 放 这 个 句子 ,到 空 语 类 [e] 处 或 其 他 地 方 , 在 屏幕 上 显示 跟 空 语 
类 的 先行 词 tailor 相关 的 探测 词 cloth 、 或 无 关 的 控制 探测 词 weight 
( 跟 accent 有 关 ) 作 对 照 。 要 求 被 试 大 声 读 出 ,然后 计算 时 间 。 结 
果 ,(D 正常 人 (控制 组 ) 能 正确 地 对 空位 填补 (gap-filling) 作 出 反应 ， 
并 正确 地 理解 全 句 的 意义 ;(ii) 韦 氏 患者 能 正确 地 对 空位 填补 作出 
反应 ,但 不 能 正确 地 理解 全 名 的 意义 ;这 ) 布 氏 患者 不 能 正确 地 对 
空位 填补 作出 反应 ,但 能 大 致 理解 全 句 的 意义 。 换 成 下 例 再 作 试验 : 


(3) The priest enjoyed the drinki that the caterer Wasl 


serving2[ei] to the guest. 


用 探测 词 wine 和 boat 在 1 2 处 测试 ,结果 大 致 跟 例 (2) 一 样 。 对 此 
的 解释 是 : 韦 氏 患 者 能 找到 空 语 类 跟 先行 词 的 句法 依存 关系 ,但 不 
能 建立 起 由 动词 决定 的 论 元 结构 , 即 缺少 给 名 词性 成 分 指派 语义 角 
色 的 能 力 ; 因 此 ,仍然 不 能 理解 句子 。 也 正 是 由 于 缺少 这 种 语义 能 
力 ,因而 他 们 造 出 来 的 句子 在 内 容 上 是 不 合理 甚至 是 苇 雇 的 。 布 氏 
患者 不 能 找到 空 语 类 跟 先行 词 的 句法 依存 关系 ,于 是 对 依赖 于 这 种 
句法 关系 的 论 元 结构 的 理解 很 困难 ,只 得 借助 于 施 事 在 前 这 种 非 语 
法 的 认 知 策略 。 一 日 磁 到 包含 在 宾语 位 置 上 有 空 语 类 的 关系 从 句 的 
句子 (如 1b) ,这 种 认 知 策略 就 不 再 奏效 ,最 终 导致 理解 失败 。 这 证 
明 语 言 理 解 也 必须 有 语法 知识 作 支 持 。 

从 上 面 的 实验 可 以 得 出 这 样 一 种 可 能 的 结论 : (i) 布 氏 患 者 被 
损 的 大 脑 额 下 回 的 神经 组 织 掌管 句法 依存 关系 等 抽象 的 句法 知识 ， 
也 许 还 有 短 时 记忆 等 职能 ; (ii) 韦 氏 患者 被 损 的 甄 平面 的 神经 组 织 
掌管 句法 成 分 之 间 的 语义 关系 等 语义 知识 。 从 中 得 出 的 理论 列 涵 
是 ; (iD 语言 知识 是 分 成 句法 .语义 等 模块 的 (modular);4i) 每 一 种 
类 型 的 语言 知识 (句法 知识 ` 语 义 知 识 ) 在 语言 处 理 中 有 其 特定 的 作 
用 ;并 且 ,(iii) 它们 在 大 脑 中 有 特定 的 部 位 和 相应 的 神经 基础 。 

显然 ,这 种 类 型 的 研究 可 以 缩短 认 知 科学 和 神经 科学 的 距离 ,使 
认 知 研究 这 种 主要 依赖 于 各 种 假设 的 黑箱 模型 向 神经 生理 学 这 种 基 
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于 实验 的 白 箱 模型 过 渡 最终, 有 和 希望 形成 一 种 研究 人 类 思维 的 灰 箱 
模型 一 一 一 种 半 透 明 的 工作 范式 。 


4 认 知 科学 和 计算 机 理解 自然 语言 


因为 高 级 水 平 上 的 认 知 活动 是 一 种 串 行 的 (serial) 信息 加 工 过 
程 , 可 以 理解 为 是 一 种 在 知识 表示 上 的 符号 表达 式 的 受 规则 约束 的 
变换 ( 即 逻 辑 运算 ) ,最 终 又 可 以 还 原 为 一 定 的 算法 和 计算 行为 。 所 
以 ,人 的 心智 过 程 可 以 理解 为 符号 处 理 的 计算 过 程 , 人 类 的 语言 理解 
过 程 也 可 以 理解 为 是 一 种 在 知识 表示 上 的 计算 过 程 ,这 使 得 计算 机 
理解 自然 语言 在 技术 上 具有 可 能 性 .9 因此 ,对 语言 的 认 知 研究 的 
自然 延伸 便 是 对 语言 的 计算 分 析 。 于 是 ,显然 地 认 知 科学 对 计算 语 
言 学 应 该 有 极为 重要 的 认识 论 和 方法 论 意义 。 


4.1 从 认 知 研究 走向 计算 分 析 


上 文 说 过 , 认 知 科学 有 这 样 一 个 基本 的 信念 : 可 以 把 计算 机 作 
为 人 类 思维 的 模型 ,也 可 以 用 计算 机 来 模拟 人 类 的 认 知 过 程 。 由 于 
语言 是 人 类 认 知 的 最 重要 和 系统 的 一 个 方面 ,因而 人 们 自然 会 尝 
用 计算 机 来 模拟 人 类 的 语言 理解 过 程 ; 从 而 造就 了 计算 机 科学 中 一 
个 重要 的 研究 领域 一 一 自然 语言 理解 (natural language understand- 
ing) ,并 逐渐 发 展 成 一 个 综合 性 的 前 沿 学 科 一 一 计算 语言 学 (comptu- 
tational linguistics)。 那 么 ,怎么 才能 让 计算 机 理解 自然 语言 呢 ? 经 
典 的 人 工 智 能 方法 是 : 首先 把 语言 处 理 看 作 是 一 种 问题 求解 过 程 ， 
弄 清 人 类 在 进行 语言 理解 时 的 工作 机 制 ;然后 把 解 题 过 程 作 出 形式 
化 的 描述 ,再 用 一 种 形式 化 体系 (formalism) 来 重 写 ; 最 后 用 程序 语 
言 来 表示 ,并 在 计算 机 上 实现 。 

一 般 来 说 ,这 种 类 型 的 计算 语言 学 研究 分 为 如 下 三 个 步骤 :9 

第 一 步 , 数 学 建 模 。 把 需要 研究 的 问题 在 语言 学 上 加 以 形式 化 


@ 详细 的 论证 请 看 圳 航 林 (1996) 。 
四 “参考 冯 志 伟 (1992) ,第 84 页 ; 钱 锋 (1990) ,第 26 一 27 页 。 
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(linguistic formalism) ,使 之 能 以 一 定 的 数学 形式 .严密 而 规整 地 表 
示 出 来 。 也 就 是 说 ,为 有 关 的 语言 问题 建立 数学 模型 。 包 括 选择 恰 
当 的 形式 语法 (formal grammar) 使 得 句子 的 结构 能 够 用 某 种 数学 形 
式 明确 而 清晰 地 表示 出 来 ,研究 在 这 种 形式 语法 之 下 如 何 分 析 和 句子 
构造 的 方法 和 步骤 ;选择 恰当 的 语义 表示 体系 使 得 句子 的 意义 能 够 
用 某 种 数学 形式 明确 而 清晰 地 表示 出 来 ,研究 在 这 种 形式 体系 之 下 
如 何 分 析 和 表示 稀 子 的 语义 结构 。 

第 二 步 , 算 法 设计 。 把 这 种 严密 而 规整 的 数学 形式 表示 为 算法 
(algorithm) ,使 之 在 计算 上 形式 化 (compnutational formalism) 。 这 
就 必须 研究 句子 分 析 的 严格 的 手续 (procedures) ,并 抽象 成 机 械 的、 
明确 的 、 一 步 步 逼 近 分 析 结 果 的 步骤 。 

第 三 步 , 程 序 实现 。 根 据 算法 用 某 种 程序 语言 编写 计算 机 程序 ， 
使 之 在 计算 机 上 加 以 实现 (computer implementation) 。 

比如 ,Winograd (1983) 可 以 说 是 认 知 主义 计算 语言 学 的 杰出 典 
范 。 他 由 下 列 两 个 问题 激发 灵感 ,尝试 建立 一 种 语言 研究 的 认 知 范 
式 (cognitive paradigmy) : 


i， 一 个 人 要 说 话 和 理解 语言 ,必须 具有 哪些 知识 ? 
ii。 为 了 在 交际 中 使 用 这 些 知识 ,人 的 心智 是 怎样 组 织 的 ? 


他 把 语言 使 用 看 作 是 一 种 以 知识 为 基础 的 交际 过 程 , 认 为 人 无 
论 是 说 话 还 是 听话 都 必须 具有 一 定 的 知识 ;比如 , 词 序 规则 、 词 汇 和 
词 的 结构 .语义 特征 所 指 关 系 、 时 制 系统 .话语 结构 .说 话 人 的 态度 、 
韵律 规约 风格 规约 .世界 知识 等 。 在 理论 方面 ,他 企图 探讨 人 是 怎 
样 习 得 .运用 这 些 知识 的 ;在 实际 运用 方面 ,他 尝试 用 计算 机 来 模拟 
人 习 得 .储存 .运用 这 些 知识 的 过 程 , 所 以 他 又 称 这 种 范式 为 计算 的 
范式 (computational paradigm) .了 

从 信息 加 工 过 程 的 观点 看 ,人 说 出 一 句 话 和 理解 一 句 话 时 ,在 大 
脑 中 有 一 个 关于 所 描述 的 外 部 世界 中 的 事物 或 事件 的 心理 映 象 ,可 
以 称 之 为 内 部 语言 ;而 人 处 理 语 言 的 过 程 就 是 把 外 部 语言 转化 为 内 


四 详 见 Winograd (1983) ,pp. 1 一 34. 另外 ,参考 黄奕 (1985) 对 该 书 的 介绍 和 评论 。 
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部 语言 ,经 过 加 工 后 再 由 内 部 语言 转化 为 外 部 语言 的 过 程 。 计 算 机 
也 可 以 用 类 似 的 过 程 来 处 理 自然 语言 : 首先 确定 一 种 语言 的 内 部 表 
示 ，, 然 后 寻求 一 种 把 所 限定 的 语言 子 集中 的 语句 转换 为 内 部 表示 的 
方法 。 于 是 ,让 计算 机 理解 语言 的 关键 是 : 应 能 对 一 般 的 自然 语言 
的 句子 作出 语义 解释 , 即 设计 一 种 一 般 的 内 部 表示 。 内 部 表示 是 自 
然 语言 处 理 的 关键 , 它 影 响 着 系统 对 语言 知识 和 世界 知识 的 描述 和 
利用 ,因此 也 影响 着 整个 处 理 系统 。9 

不 同 的 学 者 由 于 对 人 类 处 理 语言 的 心理 过 程 的 认识 不 同 , 因 而 
采用 了 不 同 的 理论 和 方法 来 建造 自然 语言 处 理 系 统 。 其 中 ,一 类 系 
统 比较 重视 句法 分 析 , 尽管 所 依据 的 语法 理论 各 不 相同 。 比 如 ， 
Winograd(1972) 年 研制 了 关于 积木 世界 的 SHRDLU 系统 ;该 系统 
可 以 接受 命令 (通过 一 只 机 械 手 ) 对 积木 进行 操作 ,回答 有 关 积 木 世 
界 所 处 的 状态 的 问题 。 他 认为 句法 需要 解决 的 问题 是 : 语言 究竟 是 
怎样 组 织 起 来 表达 语义 的 ? 他 采用 Halliday 的 系统 语法 (Systemic ， 
Grammar) ,把 句法 结构 看 作 是 生成 句子 的 过 程 中 一 系列 句法 结构 选 
择 的 结果 。 语 义 根据 一 定 的 外 部 世界 模型 作出 推论 来 指示 句法 分 
析 , 从 而 得 出 句子 的 正确 的 语义 解释 。 例 如 ,在 “I rode down the 
street in a car. ”中 ,只 有 运用 世界 知识 (街道 不 可 能 在 汽车 里 ) 作 出 
推论 ,才能 排除 in a car 作 street 的 修饰 语 。Woods(1972) 年 设计 了 
关于 月 球 化 学 成 分 的 LUNAR 系统 ,该 系统 的 句法 部 分 根据 Chom- 
sky(1965) 年 的 转换 生成 语法 模型 ,分 析出 标准 理论 所 指定 的 深层 结 
构 ,再 输入 语义 部 分 。 语 义 部 分 根据 句法 上 的 深层 结构 再 进行 语义 
信息 的 分 析 。 数 据 检索 部 分 再 根据 输入 句 的 语义 编译 成 一 种 面向 系 . 
统 的 形式 语言 ( 即 查询 语句 ) ,以便 直接 查询 数据 库 ,并 最 终 产 生 结果 
( 即 回答 ) 。Simmon(1973) 年 根据 Fillmore 的 格 语 法 (Case Gram- 
mar) 建 立 了 语义 网 络 理论 。 另 一 类 系统 不 作 详 细 的 句法 分 析 , 直接 
从 语句 中 抽取 语义 信息 。 比 如 ,Wilks 认为 , 整 段 言谈 的 内 容 是 由 一 
些 简单 的 基本 信息 构成 的 。 一 个 复杂 的 句子 也 是 由 基本 信息 通过 概 
念 连结 成 实时 的 线性 序列 ,而 不 是 语言 学 家 所 认为 的 具有 层次 的 树 


@ 详 见 杨 抒 (1988) ,第 21 一 23 页 。 
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形 结 构 。Wilks 于 1973 年 用 人 工 智 能 的 方法 设计 了 一 个 英法 机 器 
翻译 的 模型 。 这 个 模型 不 作 句 法 分 析 , 而 是 用 一 套 “ 语 义 模板 ?来 接 
受 输 入 句 中 的 信息 。 也 就 是 说 ,该 系统 把 源 语言 的 输入 语句 直接 处 
理 为 一 种 语义 结构 ,作为 一 种 中 介 成 分 ,再 据 此 生成 目标 语言 的 语 
句 ,也 可 以 在 这 种 中 介 成 分 上 作 谓 词 演算 用 于 特定 领域 。Schank 认 
为 人 脑 中 存在 着 某 种 概念 基础 (conceptual base) ,语言 理解 的 过 程 
就 是 把 语句 映射 到 概念 基础 上 去 的 过 程 。 概 念 基础 具有 完善 的 结 
构 , 人 往往 能 根据 初始 的 输入 预期 可 能 的 后 续 信 息 。 句 法 分 析 对 语 
言 理 解 的 用 处 不 大 ,因为 语言 理解 需要 的 是 输入 句 的 意思 ,而 不 是 它 
的 句法 结构 。 计 算 机 要 理解 语言 ,必须 模拟 人 的 心理 过 程 ; 要 像 人 一 
样 根 据 上 下 文 、 环 境 、 知 识 . 记 忆 等 作出 预期 (expectation), 从 而 获取 
语义 。 句 法 只 起 一 种 指引 的 作用 , 即 根据 某 些 输入 词语 形成 概念 结 
构 ,预期 它 的 句法 形式 ,便于 查找 核实 。Schank(1973) 年 提出 了 概 
念 从 属 (CConceptual Dependency, CD) 理论 ,建立 了 MARIE 模型 ， 
上 述 这 些 不 同 的 理论 和 方法 ,都 是 基于 研究 者 对 于 “人 是 怎样 理解 语 
言 的 ?这 一 问题 的 不 同 见 解 而 发 展 出 来 的 。 也 就 是 说 ,他 们 分 别 用 不 
同 的 计算 范式 来 实现 其 认 知 范式 . 


4.2 两 种 计算 范式 : 基于 规则 和 基于 统计 


上 面 介绍 的 计算 语言 学 的 研究 范式 的 特点 是 基于 规则 , 即 以 知 
识 ( 表 示 成 规则 ) 为 基础 的 方法 ,通常 称 为 人 工 智能 的 方法 。 这 种 方 
法 假定 : 如 果 计 算 机 要 处 理 自 然 语 言 , 那 么 它 必 须 跟 人 一 样 具 有 名 
法 .语义 . 语 用 、 话 语 篇 章 主题 事物 ` 周 围 世界 等 方面 的 知识 和 逻辑 
推理 能 力 。 因 为 人 处 理 语 言 时 的 心理 状态 和 心理 过 程 就 是 这 样 的 ， 
计算 机 必须 具有 跟 人 大 相同 和 相近 的 知识 才能 处 理 自然 语言 。 

而 比较 晚 起 的 语料库 语言 学 (corpus linguistics) 采 用 的 则 是 以 
语 料 统计 为 基础 的 方法 , 即 基 于 概率 的 方法 。 这 种 方法 认为 : 计算 
机 并 不 能 像 人 一 样 利 用 知识 去 理解 语言 ,人 们 也 无 法 把 理解 语言 所 
需 的 各 种 知识 形式 化 地 表示 成 规则 。 有 鉴于 此 ,这 种 方法 假定 : 如 


@ 详 见 杨 抒 (1988) ,第 22 一 26 页 ; 范 继 渡 、 徐 志 敏 (1980) ,第 9 一 19 页 。 
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果 我 们 能 对 数量 很 大 的 语言 数据 作出 定量 化 的 统计 分 析 ,那么 我 们 
就 能 对 语言 成 分 的 分 布 和 语言 成 分 之 间 的 关系 等 进行 概率 性 的 预 
测 ,从 而 补偿 计算 机 缺乏 知识 和 推理 能 力 的 缺点 .9 

虽然 语料库 语言 学 在 词类 标注 等 不 需要 涉及 结构 和 语义 的 方面 
取得 了 诱 人 的 成 绩 ,但 是 在 代词 照应 等 涉及 复杂 的 结构 和 意义 的 方 
面 一 时 还 难 见 功效 。 尽 管 从 工程 的 角度 ,语料库 语言 学 具有 广阔 的 
应 用 前 景 。 不 过 ,我 们 更 偏爱 基于 规则 的 方法 。 因 为 ,这 种 方法 用 
Hans Karlgreen 教授 的 话 来 说 ,就 是 "用 计算 的 方法 来 制定 人 类 语 
言行 为 的 模型 ,并 以 此 去 了 解 人 们 怎样 听 说 读 写 .怎样 学 习 新 知识 和 
更 新 旧 知 识 , 又 是 怎样 理解 .存储 和 组 织 语言 信息 的 ”。 他 甚至 认为 ， 
计算 语言 学 的 一 个 最 根本 的 问题 就 是 了 解 “ 人 类 的 大 部 分 活动 在 什 
么 程度 上 能 够 简化 成 机 械 的 操作 .2 显然 ,这 种 路 子 的 研究 对 认 知 
科学 和 语言 学 研究 有 更 多 的 启发 作用 。 


4.3 汉语 的 计算 结构 和 计算 模型 


上 世纪 七 十 年 代 末 ,中 国 科 学 院 心 理 研究 所 的 李 家 治 等 先生 进 
行 计算 机 理解 汉语 的 研究 。 他 们 用 Qillian 的 语义 记忆 网 络 理论 , 开 
发 了 一 个 自动 理解 汉语 的 心理 学 模型 .@ 同时 ,中 国 社会 科学 院 语 
言 研 究 所 的 范 继 淹 等 先生 进行 人 机 对 话 研究 ,开发 了 一 个 铁路 客运 
自动 问答 系统 。 这 属于 真正 的 语言 学 模型 。 为 此 , 范 先生 对 汉语 的 
是 非 问 句 进行 了 非常 系统 的 研究 ,并 对 语言 与 信息 的 关系 .语法 分 析 
的 理论 和 方法 进行 了 全 面 的 检讨 和 反思 , 提出 了 一 种 “语义 短语 语 
法 ”, 对 汉语 语言 学 的 研究 具有 很 大 的 启发 意义 .@ 七 十 年 代 中 期 ， 
中 国 社会 科学 院 语言 研究 所 的 刘 什 等 先生 进行 英汉 机 器 翻译 研究 ， 
致力 于 发 展 一 种 便于 英汉 对 应 的 “中 介 成 分 ”。 其 中 ,触及 一 些 汉语 
句法 .语义 的 深层 次 问题 ,对 汉语 语法 研究 也 有 一 定 的 参考 价值 .9 
人 


参考 桂 诗 春 、 宁 春 岩 (1997) ,第 138 一 149 页 。 

详 见 黄 建 烁 (1991) ,第 31 页 。 

详 见 李 家 治 、 郭 菜 江 、 陈 永明 (1982) 。 

详 见 范 继 淹 、 徐 志 敏 (1981.1982) 和 范 继 淹 (1986) 中 的 有 关 文章 。 
详 见 刘 伟 (1981) 。 
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从 80 年 代 后 期 到 90 年 代 , 北 京 大 学 计算 机 系 / 中 国 科 学 院 计算 
机 研究 所 的 白 硕 先 生 进 行 了 一 系列 基于 语言 学 理论 和 方法 的 计算 语 
言 学 研究 。 白 硕 (1995) 指 出 : 计算 语言 学 旨 在 以 自然 语言 处 理 ( 包 
括 理解 .生成 .人 机 对 话 、 机 器 翻译 以 及 语音 /文字 输入 的 后 处 理 等 ) 
为 技术 背景 ,揭示 自然 语言 的 词法 、 句 法 .语义 、. 语 用 诸 平 面 及 其 相互 
作用 的 计算 结构 ,把 语言 学 知识 重 塑 成 可 以 转化 为 产品 的 计算 模型 
(第 2 页 ) 。 该 书 致力 于 研究 语言 学 规则 这 种 特殊 形式 的 知识 的 发 现 
的 逻辑 实质 ,全 面 地 展示 跟 语 言 学 知识 发 现 有 关 的 各 个 层次 上 的 形 
式 化 机 制 从 数学 建 模 、. 逻 辑 分 析 、 算 法 描述 .具体 实现 直到 结果 
的 语言 学 解释 。 作 者 采用 语言 学 中 经 典 的 分 布 分 析 的 思想 ,并 针对 
真实 语 料 的 各 种 特点 ,结合 汉语 的 实际 ,从 数学 、 轴 辑 .算法 和 实现 各 
个 角度 ,全 面 阐述 了 从 诸 料 中 发 现 确定 性 语言 学 知识 (主要 是 词类 和 
句法 规则 ) 的 理论 和 方法 。 作 者 首先 从 数学 角度 讨论 了 分 布 理论 的 
完善 和 推广 ,分 别 在 词 .短语 、 词 结 的 划 类 问题 上 引入 分 布 分 析 方 法 。 
作者 在 讨论 词类 及 其 划分 的 数学 理论 时 ,提出 了 词类 划分 的 不 动 点 
理论 指出 分 布 分 析 的 任务 是 求解 最 大 不 动 点 ,澄清 了 语言 学 界 有 关 
分 布 分 析 中 含有 “逻辑 循环 ”的 误解 .证 明了 最 大 不 动 点 在 极限 意义 
下 的 可 计算 本 性 、 明 确 了 分 布 分 析 方 法 的 两 个 基本 的 逻辑 前 提 : 词 
的 同一 性 和 语言 边界 的 明确 性 ,从 而 解决 在 词类 问题 上 ”发现 什么 ” 
和 ”能 和 否 发 现 ” 两 大 问题 。 在 讨论 发 现 句法 规则 的 数学 理论 时 ,作者 
用 构造 性 的 方法 建立 一 个 基于 名 型 推 衍 的 变换 规则 系统 ,用 以 说 明 
什么 是 基本 名 型 和 怎样 从 一 些 句 型 得 到 另外 一 些 句 型 ;其 中 , 推 衍 规 
则 包括 句 型 推 衡 规 则 和 环境 推 衍 规 则 ,它们 都 是 重 写 规 则 (rewrite 
rules) ;并 阐明 这 种 规则 发 现 系统 跟 分 布 分 析 的 关系 : 同 分 布 关系 和 
作为 重 写 规则 的 推 衍 规 则 在 本 质 上 都 是 一 种 "替换 ”。 就 这 样 , 作 者 
从 词 的 分 布 分 析 推 广 到 了 短语 结构 的 分 布 分 析 , 接 下 来 他 又 把 分 布 
分 析 推 广 到 词 结 (word complex, 即 超 距 相关 的 实 词 多 元 组 ,long- 
distance dependent word n-tupple, 如 :英语 我 十 年 前 就 会 说 了 ”中 
的 “英语 …… 说 ”) 。 作 者 发 现 如 果 两 个 词 结 是 同 分 布 的 ,那么 它们 一 
定 同时 满足 或 不 满足 任何 一 个 变换 ;所 以 变换 是 实 词 多 元 组 和 多 元 
句法 环境 之 间 的 一 种 推 了 衍 关 系 , 词 结 是 变换 下 的 不 变量 .是 多 元 环境 
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的 填充 物 ,而 多 元 环境 则 是 某 一 句法 结构 中 抠 掉 了 词 结 的 剩余 部 分 ; 
由 于 词 结 是 以 各 种 不 同 的 多 元 环境 作为 分 布 框架 的 ,因而 变换 分 析 
就 是 词 结 的 分 布 分 析 ,通过 变换 分 析 可 以 给 词 结 进行 分 类 。 这 样 ,名 
子 可 以 看 作 是 由 词 结 加 上 环境 构成 的 ,句子 语义 恰好 可 以 分 解 为 词 
结 的 语义 加 上 环境 的 语义 。 比 如 ， 

“ 河 不 过 了 ”，, 指 的 是 撤销 “过 河 ”的 意愿 ; 

“ 饭 不 吃 了 ”，, 指 的 是 撤销 吃饭 ”的 意愿 


多 元 环境 “不 …… 了 ”的 语义 为 “实现 事件 刁 的 愿望 撤销 了 ”, 加 上 由 
词 结 “过 …… 河 \ 吃 …… 饭 ”的 意义 正好 是 句子 的 意义 。 作 者 甚至 希 
望 通过 词 结 的 分 布 分 析 , 来 归纳 词 结 中 的 从 属 成 分 的 语义 格 。 其 根 
据 是 词 结 的 同 分 布 类 跟 内 部 语义 角色 关系 和 外 部 组 合 能 力 相 同 的 语 
义 结 构 类 是 大 致 对 应 的 ,这 样 , 同 分 布 的 词 结 的 相同 位 置 上 的 从 属 成 
分 的 语义 格 是 相同 的 ,比如 ,上 例 中 “ 河 、 饭 ”的 语义 格 是 一 致 的 。 这 
在 方法 论 上 ,对 语言 学 研究 无 疑 是 有 很 大 的 启示 作用 的 。 


4.4 基于 认 知 并 面向 计算 的 汉语 语法 研究 


上 文 介 绍 的 那 种 以 人 类 认 知 为 基础 的 计算 语言 学 研究 ,催生 了 
一 种 基于 认 知 并 面向 计算 的 语言 研究 路 子 (a cognition-based and 
compnutation-oriented approach of linguistic study) 。 这 种 研究 路 子 
在 汉语 语法 的 研究 方面 已 经 进行 了 一 些 实践 ,并 收 到 了 一 定 的 成 效 。 
比如 , 圳 航 林 (1993) 8 5 指出 : 人 类 的 语言 理解 除了 需要 名 法、 语义 
等 语言 学 知识 之 外 ,还 依赖 于 常识 。 例 如 : 


(1) He hit the car with the rock.( 他 用 石 块 砸 车 子 ) 
(2) He hit the car with the dented fender. (他 砸 装 有 前 挡 
板 的 车 子 ) 


人 们 和 凭借 他 们 对 于 hit 与 rock (动作 一 工具 ) 、cat 与 dented fender 
(整体 一 部 分 ) 之 间 的 关系 这 种 世界 知识 (world knowledge) ,来 决定 
这 两 句 的 语法 构造 (with the rock 作 状 语 修饰 hit the car 、with the 
dented fender 作 定 语 修饰 car) ,最终 得 出 正确 的 语义 解释 。 但 是 ， 
像 hit 与 rock 的 “动作 一 工具 ”关系 .car 与 dented fender 的 “整体 一 
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部 分 ?关系 之 类 的 常识 很 难 穷 尽 , 也 不 易于 形式 化 。 为 此 ,作者 提出 
了 一 种 新 的 思路 : 把 部 分 跟 语 言 理解 相关 的 常识 化 解 为 一 种 句法 、 
语义 知识 ,通过 语言 学 的 句法 .语义 刻画 手段 来 形式 化 ;其 途径 之 一 
是 通过 名 词 的 配 价 研究 ,把 关于 事物 之 间 的 各 种 复杂 关系 的 常识 转 
化 为 一 种 代表 事物 的 有 关 名 词 之 间 的 句法 .语义 关系 。 在 这 种 思想 
的 指导 下 , 袁 艇 林 (1992、1994) 分 别 研究 了 现代 汉语 中 的 一 价 名 词 和 
二 价 名 词 的 句法 .语义 特点 ,并 结合 认 知 科学 的 研究 成 果 , 用 扩散 人 性 
激活 的 语义 记忆 机 制 和 非 单调 推理 的 逻辑 机 制 ,来 分 析 有 关 句 子 的 
语义 解释 问题 。 例 如 : 

(3) 这 种 酒 很 火 。(a, 味 儿 淡 > b. 颜色 淡 ) 

(4) 这 种 花 很 火 。(a.、 颜色 淡 之 b. 味 儿 淡 ) 


这 种 语义 理解 上 的 不 平行 性 只 能 从 语义 记忆 和 语义 推导 的 方式 上 寻 
求解 释 。 比 如 ,名 词 “ 酒 ?可 以 激活 [5 液体、 饮料、 刺激 性 的 味道 、 颜 
色 …… ] 等 一 组 语义 ,名 词 “ 花 ?可 以 激活 [植物 的 器 官 ` 观 赏 性 的 颜 
色 、 味 道 …… ] 等 一 组 语义 ,形容词 “ 淡 ? 可 以 激活 5 味道、 颜色 ) 不 浓 、 
含量) 稀薄、 态度) 不 热情 ……] 等 一 组 语义 。 人 们 根据 常识 推断 ， 
酒 作为 一 种 有 特别 味道 的 饮料 ,5 味道 ] 是 它 的 强 特征 ,就 直接 把 “ 酒 
淡 ? 理 解 为 “ 酒 的 味 儿 淡 ?。 因 为 ,根据 缺 省 推理 (reasoning by de- 
fault) 的 原理 “除非 特别 说 明 , 可 以 默认 某 个 命题 总 是 成 立 的 ” ,听话 
人 有 理由 相信 : 如 果 说 话 人 想 表 达 “ 这 种 酒 颜色 很 淡 ” ,那么 他 一 定 
会 把 表示 酒 的 弱 特 征 的 “颜色 ?说 出 来 。 同 样 ， 这 种 花 很 淡 ? 中 花 的 
强 特征 完 全 可 以 省 略 ,在 语义 解释 时 必须 优先 补 人 。 有 意思 的 是 , 白 
硕 在 九 十 年 代 后 期 ,尝试 用 范畴 语法 的 演算 规则 来 建立 一 个 语言 
解 系统 ,为 网 上 的 信息 快速 查找 服务 。 在 这 个 系统 中 ,他 除了 利用 动 
词 ,形容词 的 配 价 信息 外 ,大 量 地 把 名 词 配 价 研究 的 成 果 吸 收 了 进 
去 ,增强 了 该 系统 的 表示 能 力 和 推演 能 力 。 

袁 钳 林 (1996) 甚 至 希望 用 扩散 性 激活 的 语义 记忆 模型 和 缺 省 推 
理 的 非 单 调 逻 辑 来 建立 一 种 语言 理解 的 微观 机 制 ,用 以 解释 同一 句 
子 中 不 同 词 项 之 间 的 语义 连结 和 制约 关系 ;并 以 此 来 揭示 人 脑 处 理 
语言 信息 的 某 种 心理 过 程 , 从 而 为 认 知 心理 学 和 计算 机 理解 自然 语 
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言 提 供 强 有 力 的 语言 学 支持 。 作 为 案例 ,作者 着 重 分 析 了 下 列 例子 : 


(5) a. 这 房子 很 大 上 b. 这 房子 面积 很 大 
(6) a. 这 箱子 很 大 上 b. 这 箱子 体积 很 大 


(5a) 和 (6a) 的 句法 .语义 构造 是 一 样 的 ,但 是 语义 解释 却 很 不 一 样 。 
对 此 ,可 以 从 认 知 的 角度 假设 : 1) 大 脑 中 语义 储存 的 方式 是 网 络 
Cnetwork) 式 的 ,语义 提取 的 方式 是 扩散 性 激活 (spreading activa- 
tion) 式 的 。 并 且 , 由 于 常识 和 生活 经 验 ( 房 子 用 以 住人 、 箱 子 用 以 装 
物 ) 的 作用 ,人 们 在 听 / 看 到 “房子 ?这 个 词 时 ,5 面积 ] 这 一 语义 节点 优 
先 激活 , 它 跟 其 他 词 的 语义 节点 的 连接 权 值 增 大 ;人 们 在 听 / 看 到 “ 箱 
子 ” 这 个 词 时 ,5 体积 ] 这 一 语义 节点 优先 激活 , 它 跟 其 他 词 的 语义 节 
点 的 连接 权 值 增 大 。(2) 语义 推导 的 方式 是 基于 知识 的 缺 省 推理 。 
虽然 “大 ”的 语义 可 以 跟 [5 面 积 、 体 积 . 数 量 .强度 力量 ] 等 语义 节点 相 
连接 ,但 是 人 们 在 听 / 看 到 “房子 大 ”时 可 以 直接 理解 为 [房子 的 面积 
大 ], 听 /看 到 “箱子 大 ”时 可 以 直接 理解 为 [箱子 的 体积 大 ]。 因 为 , 听 
话 人 相信 说 话 人 一 定 遵守 交际 的 缺 省 约定 ,如 果 说 话 人 要 表达 [房子 
的 体积 大 ] 或 [箱子 的 面积 大 ] 这 种 意思 ,那么 他 必须 特别 声明 ,不 能 
省 去 “体积 ?或 “面积 "这 类 词语 。 

非常 有 意义 的 是 , 姬 东 鸿 、 黄 昌 宁 (1996) 在 建立 关于 汉语 形容 词 
跟 名 词 的 语义 组 合 的 计算 模型 时 ,还 真 的 运用 圳 艇 林 (1994) 提 出 的 
语义 扩散 性 激活 和 缺 省 推理 的 机 制 . 语 义 特征 强 弱 的 优先 顺序 以 及 
相关 的 规则 和 策略 ,作为 消解 由 多 重 属性 继承 引起 的 冲 罕 的 机 制 。 
例如 


(7) 王 明 很 难受 。(a. 心里 难受 > b。 肚 子 难受 ) 
(8) 这 孩子 很 灵 。(a, 脑子 灵 之 b。 耳 条 灵 ) 
(9) 衣服 很 大 方 。(a.。 样子 大 方 . 这 b。 领子 大 方 ) 


这 里 名 词 “ 王 明 ” 既 具有 心理 属性 .也 具有 生理 属性 ,而 形容 词 “ 难 受 ” 
既 可 以 描写 心理 属性 .也 可 以 描写 生理 属性 。 这 样 , 当 名 词 的 语义 跟 
形容 词 的 语义 相互 组 合 时 ,就 势必 会 发 生 多 重 属性 的 冲突 的 问题 。 
怎么 来 消解 这 种 冲突 呢 ? 根据 囊 毓 林 (1994) 8 5 提出 的 心理 属性 强 
于 生理 属性 .整体 属性 强 于 局 部 属性 的 优先 顺序 ,可 以 用 这 种 属性 继 
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承 的 优先 规则 来 解决 这 一 问题 。 像 这 种 基于 认 知 的 语言 研究 ,计算 
语言 学 研究 者 和 心理 语言 学 研究 者 都 是 比较 感 兴趣 的 。 

圳 航 林 (2004) 则 尝试 用 认 知 图 式 (Ccognitive scheme) 的 概念 来 
分 析 词 的 意义 和 用 法 ,并 从 中 引导 出 可 以 转换 成 算法 化 的 规则 的 形 
式 表 示 。 例 如 : 


(10) 满 身 是 汗 ~ 全 身 是 汗 ” 满 商场 的 人 ~ 全 商场 的 人 
(11) 满 脸 是 汗 ~ x 全 脸 是 汗 x 满 公司 的 人 ~ 全 公司 的 人 


对 于 “ 满 2? 和 ”全 ”在 意义 和 用 法 上 的 不 对 称 性 ,可 以 用 隐喻 投射 
Cmetaphor projection) 理 论 来 解释 : 跟 “ 满 ?相关 的 语言 表达 以 容器 
Ccontainer) 隐喻 为 基础 , 跟 * 全 ”相关 的 语言 表达 以 套件 (suite) 隐 喻 
为 基础 。 在 人 们 的 观念 中 ,身体 和 商场 既 可 以 看 作 是 容器 、 又 可 以 看 
作 是 套件 ;但 是 “人 ?中 “公司 ?这 种 抽象 的 机 构 难 以 形成 容 物 跟 容 器 
的 关系 “ 脸 ” 这 种 人 体 部 件 一 般 不 再 分 解 为 几 个 更 小 的 部 件 , 即 它 不 
是 套件 。 值 得 注意 的 是 ,在 以 容器 隐喻 为 基础 的 语言 表达 中 ,容器 在 
室 间 上 具有 拓扑 可 变性 (立体 .平面 等 ) : 


(12) 满 杯 子 啤 酒 一 满 头 白 发 一 满 纸 荒唐 言 一 满 枝 头 麻 短 
一 满门 抄 斩 一 满眼 春色 


说 明 容 器 隐喻 等 在 心理 上 的 表征 应 该 是 抽象 的 图 式 , 是 一 种 意象 图 
式 (Cimagery scheme) 。 不 同 的 隐喻 反映 人 们 感知 事物 和 事件 时 的 不 
同 的 认 知 方式 ,从 而 构成 了 不 同 的 意象 。 意 象 可 以 抽象 为 结构 化 的 
图 式 , 图 式 可 以 分 解 为 结构 成 分 及 其 构成 方式 。 如 果 找 出 隐喻 表达 
的 构成 成 分 及 其 结构 关系 跟 相 应 图 式 的 构成 成 分 及 其 结构 方式 之 间 
的 映射 关系 ,就 可 以 用 产生 式 写 出 算法 化 的 关于 隐喻 表达 的 语义 解 
释 规 则 。 比 如 ,对 于 容器 隐喻 来 说 ,其 意象 图 式 的 结构 成 分 是 一 个 边 
界 , 它 把 相关 的 空间 划分 为 内 部 和 外 部 两 个 部 分 ,从 而 在 人 的 心理 上 
形成 一 个 容器 的 构 型 。 抓 位 了 这 一 点 ,我 们 就 可 以 给 出 从 容器 隐喻 
表达 的 句法 形式 到 语义 表达 的 形式 化 的 .并 且 经 过 调整 后 可 以 是 算 
法 化 的 规则 系统 。 假 如 把 “ 满 桌 子 糖果 、 满 桌子 的 糖果 、 满 桌子 是 糖 
果 ?” 等 格式 合 记 作 S1: 满 十 NP; 十 (的 /是 十 )NP: ,那么 可 以 用 一 阶 
谓词 逻辑 写 出 Sl 的 如 下 语义 解释 规则 R1l: 
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这: 满 十 NP; 十 (的 /是 十 )NP: ;then: 

{i. “NPi is-a CONTAINER,，“NP, ”is-a CONTENTS; 
“NP: ”is-in“NP, ”; 

ii。 习 ,，V -Lis-in (z，y)]->Z 一 “ANP:，，y 一 上 NP 7; 

iii。CONTAINER has many SUB-SPACE ，i.e. ，y 王 光 十 
入 十 …… 十 3 

iv。CONTENTS has many SUB-CONTENTS，i. e. ，Z 一 
十 

克 六 习 [has ko 二 加 关 人 人 NB 因 全 NP 
i 一 1，2，…，n》} 


如 果 把 语句 实例 “ 满 桌 子 ( 的 /是 ) 糖 果 ?” 代 人 R1, 那 么 可 以 得 出 如 下 
的 语义 表达 式 Ml : 
“桌子 ?是 容器 ， 糖 果 ? 是 容 物 ; 糖果 ?在 “桌子 "> 上; 
存在 着 一 张 桌 子 , 所 有 的 “糖果 ?都 在 这 张 “ 桌 子 ? 上 ; 
“桌子 ( 面 ) ?有 许多 子 空间 糖果? 有 许多 子 集 ; 
“桌子 ( 面 ) ”的 每 一 个 子 空 间 中 都 有 一 些 “糖果 ”。 
对 于 套件 隐喻 来 说 ,其 意象 图 式 的 结构 成 分 是 一 个 整体 和 若干 
个 部 分 .一 个 体现 各 部 分 如 何 构成 整体 的 构 型 。 抓 住 了 这 一 点 ,就 可 
以 参照 上 文 对 容器 表达 的 计算 分 析 , 把 套件 的 各 部 分 看 作 是 一 个 个 
容器 ,于 是 套件 就 成 为 一 套 容器 ;相应 地 ,在 这 些 容 器 中 的 容 物 也 成 
为 一 套 离散 的 容 物 。 这 样 , 就 可 以 给 出 从 套件 隐喻 表达 的 句法 形式 
到 语义 表达 的 形式 化 的 .并 且 经 过 调整 后 可 以 是 算法 化 的 规则 系统 。 
假如 把 “全 身 伤痕 、 全 身 的 伤痕 、 全 身 是 伤痕 ”等 格式 合 记 作 S2: 全 
十 NP: 十 (的 /是 十 )NP: ,那么 可 以 用 一 阶 谓词 膛 辑 写 出 S2 的 如 下 
语义 解释 规则 R2: 
i 计 : 全 十 NP: 十 (的 /是 十 )NP:;，then: 
{i.“NP1?” is-a-setrof CONTAINERS,，“NP: ”is-a-set-of 
CONTENTS; 
“NP;:， is-in“NP,”; 
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ii， 习 >y，Vz [is-in (z，y)] 一 z 一 “NP:”，y 一 "NP 7” ; 

iii。CONTAINERS is-a SET consists of many SUB-SET， 
到 二 现下 竹本 起 

iv。CONTENTS is-a SET consists of many SUB-SET， 
iesy 亦 二 1 十 ar 

砚 _ 六 可 as 的 均 元 |] NER 全 Pi25 
2 一 1,2… ni; 

vi XCzlyz 和 wy) [is-in (zyy) 取 is-in (zy ) 区 … 
取 is-in (zuyyn)]; 

过 -了 三 允 十 如 二 十 2 


如 果 把 语句 实例 “全 单位 (的 ) 职 工 ” 代 入 有 人 2 ,那么 可 以 得 出 如 下 的 语 
义 表达 式 M2 : 
“单位 ?是 一 套 容器 “职工 ?是 一 批 容 物 ;职工 ?在 单位， 
中 ; 
存在 着 一 个 “单位 ? ,所 有 的 “职工 ?都 在 这 个 “单位 中; 
“单位 2 有 许多 子 集 ( 即 部 门 ), “职工 有 许多 子 集 ， 
“单位 ?的 每 一 个 子 集 ( 即 部 门 ) 中 都 有 一 个 “职工 ?的 子 集 ; 
每 一 个 子 单 位 ( 即 部 门 ) 中 的 职工 子 集 的 总 和 就 是 “全 单位 
(的 ) 职 江 ”， 


这 种 研究 的 目标 是 ,从 隐喻 的 角度 分 析 诸 如 此 类 的 词语 同 现 限制 问 
题 ,并 把 隐喻 分 析 提 升 到 意象 图 式 的 抽象 水 平 。 藉 此 ,希望 把 语言 
认 知 解释 转换 成 算法 规则 和 形式 表示 ,从 而 实现 认 知 和 计算 的 统一 。 


5 结语 : 人 门 的 台阶 


许多 年 轻 的 朋友 问 : 要 从 事 计 算 语言 学 方面 的 学 习 和 研究 ,应 
该 有 哪些 知识 上 的 准备 ? 这 可 以 从 计算 语言 学 的 定义 上 说 起 。 粗 略 
地 说 ,计算 语言 学 是 一 门 用 计算 机 并 为 计算 机 研究 语言 的 综合 性 学 
科 。 用 计算 机 来 研究 语言 ,不 仅 指 把 计算 机 这 种 电子 装置 作为 语言 
研究 的 辅助 工具 ,比如 ,用 计算 机 收集 语 料 ` 分 类 整理 .分 布 统计 、 提 
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取 各 种 数据 等 。 这 跟 化 学 、 物 理学、 生物 学 中 的 计算 化 学 .计算 物理 
学 .计算 生物 学 有 点 相近 ,它们 或 者 运用 简单 的 方程 和 算法 在 计算 机 
上 进行 大 量 的 重复 运算 ,或 者 用 计算 机 对 实验 结果 进行 十 分 精细 的 
计算 分 析 、 反 复 提 高 以 得 到 一 种 新 的 理论 。 更 重要 的 是 指 用 计算 机 
科学 的 理论 、 概 念 和 方法 来 研究 语言 ,我 们 认为 这 一 点 才 是 计算 语言 
学 更 本 质 ,更 深刻 的 特点 。 比 如 , 白 硕 (1995) 用 理论 计算 机 科学 的 观 
点 剖析 当代 语言 学 的 方法 .并 进行 计算 模拟 的 做 法 ,在 一 定 程度 上 展 
示 了 这 类 研究 的 理论 魅力 和 实用 价值 。 

在 这 方面 ,计算 神经 科学 (computational neuroscience) 为 我 们 
提供 了 一 个 光辉 的 典范 。 作 为 神经 科学 的 一 个 新 的 分 支 , 计 算 神经 
科学 通过 建立 脑 模型 来 前 明神 经 系统 信息 加 工 的 计算 原理 ,以 了 解 
人 和 动物 的 神经 系统 是 怎样 使 用 它 的 微观 组 件 及 其 相互 作用 来 表征 
和 处 理 信息 的 。 具 体 的 做 法 是 : 把 神经 科学 对 脑 结 构 和 机 能 从 整 
体 、 细 胞 和 分 子 水 平 上 进行 的 生物 学 研究 作出 数学 概括 、. 找 出 规律 和 
算法 ,并 运用 现代 数字 计算 机 或 人 工 神 经 网 络 加 以 模拟 ;其 最 终 目 标 
是 : 揭露 脑 的 电信 号 和 化 学 信号 ,寻求 如 何 表 达 和 处 理 神 经 信息 、 并 
在 智能 活动 中 发 生变 化 的 规律 。 这 种 脑 模拟 研究 通常 使 用 简化 的 脑 
模型 (simplifying brain models) 。 因 为 ,即使 是 最 成 功 的 生物 脑 模型 
也 不 能 揭示 脑 组 织 的 全 部 实际 功能 ;所 以 ,计算 神经 科学 需要 抓 住 重 
要 的 原理 进行 简化 模拟 。 简 化 模型 的 研究 必须 提供 建立 模型 的 理论 
框架 ,算法 及 其 约束 条 件 ,而 这 种 简化 模型 中 的 算法 及 其 约束 条 件 往 
往 可 以 通过 现代 数字 计算 机 或 神经 计算 机 来 加 以 实现 。 可 见 , 计 算 
神经 科学 并 不 意味 着 大 量 的 计算 、 也 不 意味 着 一 定 要 使 用 现代 计算 
机 ,而 是 要 对 大 脑 的 认 知 过 程 进 行 表征 ,把 其 信息 加 工 过 程 和 信息 存 
储 过 程 跟 计 算 机 进行 类 比 , 从 中 得 到 新 的 概念 和 数学 表达 。 比 如 ， 
Hopfield 模型 的 建立 并 没有 借助 计算 机 进行 大 量 的 数值 计算 ,但 是 
这 种 模型 有 助 于 对 大 脑 获取 信息 ( 即 学 习 ) 和 提取 信息 ( 即 记忆 ) 过 程 
的 理解 ;因此 ,这 种 数学 模拟 仍 是 计算 神经 科学 的 一 个 组 成 部 分 。 同 
样 ,我 们 认为 ,计算 语言 学 并 不 意味 着 大 量 的 计算 、 也 不 意味 着 一 定 
要 使 用 现代 计算 机 ,而 是 要 对 大 脑 中 的 语言 处 理 过 程 进 行 表征 ,把 语 
言 信息 的 加 工 、 存 储 过 程 跟 计算 机 进行 类 比 , 从 中 得 到 新 的 概念 和 数 
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学 表达 ,以 形成 便于 机 器 处 理 的 语法 规则 或 语法 形式 体系 。 计 算 神 
经 科学 致力 于 寻求 理解 智能 活动 的 神经 基础 的 新 概念 、 新 算法 ,并 在 
把 新 算法 及 其 约束 条 件 跟 当代 各 类 计算 机 进行 类 比 中 , 发现 设计 智 
能 化 计算 机 、 智 能 化 机 器 人 和 智能 化 武器 的 新 原理 。 并 且 , 计 算 神 经 
科学 提出 的 脑 模型 能 够 对 神经 系统 的 某 些 行 为 作出 可 以 验证 的 预 
测 ,从 而 较 早 地 预见 到 生物 脑 研究 工作 的 成 果 。 因 此 ,计算 神经 科学 
对 大 脑 的 模拟 研究 ,不仅 为 信息 科学 的 发 展 提供 了 坚实 的 神经 科学 
基础 ,而 且 对 神经 科学 和 心理 科学 的 发 展 也 起 着 巨大 的 推进 作用 .9 
我 们 则 希望 ,采用 理论 计算 机 科学 的 观点 所 进行 的 计算 语言 学 研究 ， 
不 仅 对 信息 科学 .神经 科学 和 心理 科学 起 推动 作用 ,而 且 对 语言 科学 
的 发 展 起 巨大 的 推动 作用 。 

为 计算 机 研究 语言 , 指 为 了 计算 机 能 处 理 自然 语言 而 研究 语言 。 
这 包括 两 方面 的 工作 : (1) 对 自然 语言 的 结构 和 意义 规律 进行 挖 
掘 ,提炼 出 便于 形式 化 和 算法 化 的 句法 .语义 规则 ,建立 合适 的 语法 
学 理论 模型 ,来 更 好 地 组 织 语言 的 句法 .语义 规则 ;(2) 把 语言 学 家 
对 语言 的 句法 .语义 . 语 用 诸 平 面 上 的 研究 成 果 进 行 数学 概括 ,用 某 
种 形式 化 体系 来 组 织 和 表示 语言 的 结构 和 意义 规则 ,再 找 出 恰当 的 
算法 来 描述 句子 的 结构 分 析 或 语义 解释 的 严格 的 步骤 (procedure)， 
最 后 根据 算法 用 相应 的 计算 机 语言 来 编程 实现 。 上 面 (1) 所 说 的 工 
作 本 应 完全 由 理论 语言 学 家 来 承担 ,但 是 ,由 于 理论 语言 学 关心 的 方 
面 不 一 定 跟 计算 语言 学 家 一 致 ,因而 计算 语言 学 家 常常 会 发 现 : 语 
言 学 中 并 无 他 们 想 要 的 句法 .语义 规则 或 语法 理论 模型 ;于 是 ,计算 
语言 学 家 只 得 亲自 动手 来 寻找 句法 .语义 规则 ,甚至 建构 更 适合 计算 
机 的 语法 理论 模型 。 在 为 计算 机 研究 语言 这 一 点 上 ,计算 语言 学 有 
别 于 计算 化 学 和 计算 神经 科学 。 在 计算 化 学 中 ,并 没有 为 计算 机 研 
究 化 学 这 种 任务 ;在 计算 神经 科学 中 ,也 没有 为 计算 机 研究 神经 的 结 
构 和 功能 这 种 任务 。 那 么 ,为 什么 计算 语言 学 要 特别 地 强调 为 计算 
机 研究 语言 这 一 点 呢 ? 原因 可 能 有 两 点 : 〈i) 语言 学 的 研究 对 象 是 
自然 语言 ,语言 学 的 研究 工具 (用 以 描写 语言 现象 .表述 语言 规律 .总 


@ 关于 计算 神经 科学 ,参考 沈 政 、 林 许 之 (1992) ,第 44 一 49 页 。 
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结 研 究 结果 ) 也 是 自然 语言 。 也 就 是 说 ,自然 语言 既是 语言 研究 的 对 
象 语言 (object language) ,也 是 语言 研究 的 元 语言 (metalanguage) 。 
由 于 计算 机 无 法 直接 理解 自然 语言 ,因而 首先 必须 把 用 自然 语言 
述 的 语言 规律 形式 化 \ 符 号 化 。(i) 语言 是 一 种 心智 (mind) 现 象 ,是 
跟 人 的 认 知 ,心理 密切 相关 的 ;为 了 让 计算 机 能 理解 自然 语言 ,必须 
以 计算 机 为 信息 加 工 模型 来 考察 人 类 语言 理解 的 心理 过 程 , 以 便 在 
计算 机 上 模拟 实现 。 

有 了 这 样 一 番 理解 ,那么 显而易见 ,要 从 事 计算 语言 学 方面 的 学 
习 和 研究 ,首先 应 该 了 解 或 掌握 语言 学 和 计算 机 科学 方面 的 一 些 基 
础 知识 。 语 言 学 方面 ,包括 语音 学 .实验 语音 学 . 音 系 学 、 句 法学、 语 
义学 . 语 用 学 .话语 语言 学 等 ;计算 机 科学 方面 ,包括 体系 结构 、 数 据 
结构 .算法 理论 ,程序 语言 .形式 语言 和 自动 机 理论 .复杂 性 和 可 计算 
性 理论 .人工 智能 原理 等 。 再 有 是 这 两 门 学 科 的 综合 学 科 一 一 计算 
语言 学 。 此 外 ,心理 学 方面 ,包括 认 知 心理 学 .神经 心理 学 、 实 验 心 理 
学 .语言 心理 学 等 。 还 有 ,数理 逻辑 方面 的 知识 也 是 不 可 缺少 的 ;再 
奢侈 一 点 , 脑 科 学 .神经 生物 学 西方 现代 哲学 (特别 是 心智 哲学 、 科 
学 哲学 ) 也 是 应 该 关注 的 。 不 过 ,上 面 涉及 的 这 么 多 的 门类 和 内 容 ， 
不 一 定 非得 在 短 短 几 年 内 全 部 都 来 学 一 遍 , 而 是 要 求 放宽 眼界 ,有 长 
远 的 目标 和 计划 。 一 般 来 说 ,在 六 到 十 年 时 间 内 ,程度 深浅 不 同 地 摸 
一 遍 , 这 应 该 是 大 家 都 可 以 做 到 的 。 

现在 说 说 怎么 着 手 进行 这 方面 的 研究 。 在 很 大 程度 上 , 这 要 取 
决 于 每 个 人 的 不 同 的 环境 条 件 。 比 如 ,我 的 师兄 陈 小 荷 ,在 北大 攻读 
博士 学 位 期 间 ,并 没有 接触 多 少 计算 语 言 学 方面 的 知识 ,博士 论文 做 
的 是 江西 丰 城 话 的 语法 ;毕业 以 后 分 配 到 北京 语言 学 院 语 言 信息 研 
究 所 ,工作 的 需要 促使 他 不 断 地 学 习 这 方面 的 知识 ,学 习 编 程 、 尝 试 
建 语料库 ,参加 905 语义 工程 ,促使 他 思考 和 研究 面向 工程 的 语义 分 
析 体 系 问 题 , 又 从 自动 句法 分 析 的 角度 考虑 汉语 词类 问题 ,等 等 , 逐 
步 进 入 这 一 领域 。 王 惠 在 北大 中 文系 读书 时 做 的 硕士 论文 是 4 从 及 
物性 系统 看 现代 汉语 句 式 》, 毕 业 后 分 配 到 北京 大 学 计算 语言 学 研究 
所 ,工作 的 需要 ,促使 她 逐步 了 解 中 文 信息 处 理 方面 的 知识 ,并 着 力 
于 对 面向 中 文 信息 处 理 的 语法 信息 词典 和 语义 词典 的 研究 。 往 卫 东 
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在 浙江 大 学 中 文系 读本 科 时 已 经 接触 了 语言 信息 处 理 方面 的 有 关内 
容 , 到 北大 中 文系 跟 陆 俭 明 先生 学 习 语 法 学 ,同时 在 计算 语言 学 研究 
所 接受 俞 士 汶 先生 指导 ,博士 生 期 间 继 续 这 种 模式 ,在 计算 语言 学 方 
面 有 比较 好 的 基础 和 训练 ;毕业 后 留 在 中 文系 ,同时 在 计算 语言 学 研 
究 所 承担 研究 任务 ,先后 对 面向 中 文 信息 处 理 的 汉语 短语 结构 的 约 
束 条 件 和 语义 知识 的 表示 等 问题 ,进行 了 比较 系统 和 这 入 的 考察 , 形 
成 了 一 些 独 到 的 见解 。 但 是 ,大 多 数 人 可 能 会 跟 我 一 样 , 在 中 文系 读 
书 , 毕 业 后 又 在 中 文系 教书 。 因 此 ,说 说 我 的 学 习 经 历 , 也 许 对 大 家 
也 有 一 定 的 借鉴 作用 。 上 世纪 80 年 代 初 ,我 在 (百科 知识 》 上 看 到 和 理 
论 计算 机 科学 \ 人 工 智 能 .语言 信息 处 理 方面 的 文章 ,又 在 (国外 语言 
学 》 和 《中 国语 文 》 上 看 到 计算 语言 学 特别 是 跟 汉语 相关 的 人 机 对 
话 、 机 器 翻译 方面 的 文章 ,开始 对 计算 语言 学 很 神往 。1984 年 在 杭 
州 大 学 中 文系 上 研究 生 ,在 数理 逻辑 》 课 上 ,经 常 听 到 邢 国 权 老 师 讲 
数理 逻辑 和 人 工 智能 .数理 逻辑 和 机 器 处 理 语言 的 关系 ,在 他 的 鼓励 
下 学 习 了 Basic 编程 语言 。 也 看 了 一 些 计 算 机 方面 的 书籍 ,特别 对 
范 继 滤 先 生 那 种 语法 研究 和 信息 处 理 互 相 结合 、 互 相 促 进 的 研究 模 
式 顶 礼 膜 荐 。1985 年 春天 ,不 仅 在 杭 大 聆听 了 范 先 生 关 于 人 机 对 话 
的 讲座 ,还 在 宾馆 向 范 先 生 请 教 了 汉语 语法 研究 的 门 径 问 题 , 范 先生 
的 精彩 指点 ,使 我 深 受 教 益 , 有 没 齿 难 忘 之 感 。1987 年 到 北大 攻读 
博士 学 位 ,参加 由 中 文系 朱德 牛 和 陆 俭 明 等 先生 、 计 算 机 系 马 希 文 和 
林 建 祥 等 先生 ` 心 理学 系 王 环 等 先生 ` 哲 学 系 赵 光 武 等 先生 组 织 的 人 
工 智 能 的 哲学 基础 的 讨论 班 ,参加 了 计算 机 系 青 年 教师 王 培 组 织 的 
一 个 关于 人 工 智 能 和 认识 论 方 面 的 讨论 班 ,又 参加 了 林 建 祥 老 师 主 
持 的 机 器 学 习 讨 论 班 ,还 经 常 跟 马 希 文 先生 的 博士 生 白 硕 一 起 讨论 
语言 分 析 及 其 计算 机 处 理 问 题 。1990 年 分 配 到 清华 大 学 中 文系 工 
作 ,在 罗 振 生 老 师 的 奔走 和 帮助 下 ,得 以 利用 清华 大 学 智能 技术 与 系 
统 国家 实验 室 的 机 房 , 一 边 学 C 语言 ,一 边 在 机 器 上 学 习 编 程序 。 
在 学 习 计 算 机 科学 技术 方面 的 有 关 知 识 的 同时 ,不 断 地 参加 中 文系 
和 计算 机 系 的 有 关 讨 论 和 研究 生 的 开题 和 答辩 ,还 协助 罗 振 生 老 师 
指导 计算 语言 学 方面 的 研究 生 。 我 基本 上 是 站 在 语言 学 的 角度 ,从 
理论 上 思考 计算 机 理解 自然 语言 问题 。 抓 住 跟 语言 理解 有 关 的 知识 
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的 形式 表示 问题 ,探讨 动词 名词 配 价 的 作用 ;同时 ,考虑 跟 语义 推导 
有 关 的 认 知 机 制 和 逻辑 机 制 问题 .。《 语 言 的 认 知 研究 和 计算 分 析 ; 一 
书 中 的 好 几 篇 文章 ,就 是 这 样 的 背景 上 形成 的 。 现 在 回 过 头 来 ,觉得 
每 一 个 语法 学 者 都 可 以 做 的 工作 是 : 挑 某 一 种 自己 觉得 是 比较 特 
别 `. 也 比较 有 趣 ( 好 玩 ) 的 语言 现象 ,比如 某 种 语法 格式 ; 想 一 想 ( 内 
省 ) 你 自己 是 怎样 从 这 一 符号 串 上 得 出 这 种 语法 形式 的 意义 的 ,要 理 
解 这 种 语法 形式 所 表达 的 意义 ,需要 哪些 句法 .语义 等 语言 内 的 知 
识 , 还 需要 哪些 百科 知识 类 的 常识 ,需要 遵循 什么 样 的 规约 、 作 出 怎 
样 的 逻辑 推导 ,等 等 。 然 后 ,对 这 一 格式 及 其 有 关 实 例 作 出 具体 的 描 
写 和 分 析 ,努力 找 出 使 这 一 格式 合格 的 名 法、 语义 约 束 条 件 , 并 尽量 
明确 地 表示 出 来 ;然后 再 考虑 哪些 常识 和 推理 方式 参与 了 这 一 理解 
过 程 , 它 们 是 怎样 跟 有 关 的 句法 .语义 知识 发 生 交互 作用 的 ,能 不 能 
用 一 个 比较 抽象 和 统一 的 模型 把 这 一 语言 理解 过 程 (各 种 因素 及 其 
作用 方式 ) 表 达 出 来 。 能 做 到 这 一 步 , 也 等 于 是 为 这 一 语法 格式 的 意 
义理 解 建立 了 一 个 初级 的 逻辑 模型 。 至 于 怎样 精炼 化 为 严格 的 数学 
模型 .判定 该 形式 模型 是 否 具备 可 计算 性 度量 计算 的 复杂 性 ,以 及 
算法 设计 、 程 序 实现 等 工作 ,完全 可 以 由 计算 机 专家 来 做 。 因 为 计算 
语言 学 的 工作 是 一 种 系统 工程 ,语言 学 家 只 要 提出 一 个 尽 可 能 可 靠 、 
简单 的 初步 模型 就 可 以 了 。 因 此 ,对 于 语言 学 家 来 说 ,计算 语言 学 工 
作 主 要 任务 是 : 尽 可 能 详尽 而 明确 地 描写 有 关 语 言 现 象 , 探 明 有 关 
因素 的 作用 方式 及 其 关系 ,揭示 使 这 一 语言 现象 成 为 合格 、. 可 接受 的 
各 种 约束 条 件 。 至 于 你 会 不 会 编程 序 , 懂 不 懂 算 法 理论 和 数据 结构 ， 
倒 不 一 定 太 重 要 。 当 然 , 最 好 大 家 对 计算 机 是 怎样 工作 (特别 是 怎样 
处 理 自然 语言 ) 的 原理 有 所 了 解 ; 这 样 可 以 帮助 我 们 了 解 什么 样 的 约 
束 条 件 和 规则 是 重要 的 ,什么 样 的 语言 学 模型 对 信息 处 理 是 有 用 的 。 
由 于 我 们 是 语言 学 者 ,因而 我 们 从 认 知 、 计 算 等 角度 思考 语言 问题 
时 ,目的 仍 主要 在 于 检验 各 种 语言 理论 和 分 析 方 法 的 效能 , 希 帮 以 计 
算 机 为 参照 ,来 提高 语言 学 的 研究 水 平 ,使 语言 学 真正 成 为 一 门 严 格 
意义 上 的 科学 。 
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面向 当代 科技 的 语言 研究 的 
理论 和 方法 


本 文 是 一 篇 演讲 稿 , 讲 述 搞 语 言 研究 的 人 怎样 吸收 当 代 科 学 技术 的 
有 关 理 论 和 方法 上 的 成 果 , 形 成 一 些 具有 开拓 性 的 理论 意义 和 应 用 价值 
的 课题 。 具 体 地 说 ,怎样 从 认 知 心理 学 和 计算 机 科学 和 技术 的 角度 ,来 形 
成 一 些 对 解决 汉语 语法 比较 有 效 的 理论 和 方法 。 主 要 通过 自己 做 的 四 个 
研究 案例 (语言 理解 .语义 演算 .词类 辨认 定语 排 序 ) ,来 讨论 上 面 提 出 的 
这 个 问题 ,从 而 展示 认 知 语言 学 和 计算 语言 学 相互 结合 的 一 种 可 能 的 研 
究 路 子 。 


0 引言 


我 今天 要 讲 的 题目 是 “面向 当代 科技 的 语言 研究 的 理论 和 方 
法 ”。 主 要 想 谈 的 问题 是 搞 语 言 研究 的 人 怎样 面 对 当 代 科 学 技术 的 
发 展 ,形成 一 些 具 有 开拓 性 的 课题 。 更 具体 一 点 说 ,就 是 怎样 从 认 知 
心理 学 和 计算 机 科学 技术 的 角度 来 寻找 一 些 对 解决 汉语 语法 比较 有 
效 的 理论 和 方法 。 这 里 边 涉及 到 一 些 比较 关键 的 当代 科学 技术 方面 
的 概念 ,比如 : 认 知 、 计 算 以 及 认 知 和 计算 的 关系 等 。 但 是 ,我 不 准 
备 直接 从 这 几 个 概念 上 讲 ,因为 那 比较 抽象 ,也 不 好 懂 。 我 打算 从 四 
个 研究 案例 , 即 自己 做 过 的 几 个 工作 上 来 回答 上 文 提 出 的 这 个 问题 。 


1 语言 理解 的 心理 机 制 和 逻辑 机 制 


先 讲 第 一 个 问题 ,关于 语言 的 意义 理解 的 一 个 例子 。 

大 家 知道 ,人 的 大 脑 现在 仍 是 一 种 密封 的 机 构 ,无 法 打开 。 就 是 
说 ,你 无 法 打开 一 个 活 人 的 大 脑 去 看 看 内 部 的 工作 机 制 是 什么 ` 它 是 
怎样 来 解决 问题 的 ,所 以 只 能 从 另外 一 个 角度 来 研究 大 脑 的 各 种 生 
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物 机 构 是 怎样 工作 的 。 有 一 种 办 法 叫做 黑箱 模型 : 虽然 人 的 大 脑 是 
一 个 密封 的 黑箱 ,我 们 无 法 打开 来 看 ;但 是 ,可 以 比较 这 个 黑箱 的 输 
入 和 输出 这 两 方面 的 情况 ,然后 来 建造 、 构 拟 大 脑 的 工作 机 制 是 怎样 
怎样 的 。 也 就 是 说 ,通过 这 种 输入 和 输出 的 关系 ,来 假设 大 脑 的 工作 
原理 。 现 在 ,我们 先 讨论 两 个 最 简单 的 句子 ， 


《1) 房子 大 。{ 房 子 的 面积 大 } 二 (房子 的 体积 大 ) 
《2) 箱子 大 。{ 箱 子 的 体积 大 } 二 (箱子 的 面积 大 ) 


听 到 这 两 个 句子 后 ,我 们 的 大 脑 对 它们 进行 加 工 , 以 求 达 到 语义 理 
解 。“ 房 子 大 ”是 指 房子 的 什么 大 ? 体积 大 还 是 面积 大 ? 我 们 常 说 
“ 老 张 家 分 到 一 套房 子 , 多 少 平米 呀 ?显然 , 问 的 不 是 体积 , 问 话 人 关 
心 的 是 面积 。 通 过 语义 理解 得 出 来 的 语义 解释 是 { 房 子 的 面积 大 } 。 
“箱子 大 ” 则 指 体积 大 ,箱子 能 装 多 少 东 西 。 得 出 来 的 语义 解释 是 { 箱 
子 的 体积 大 } 。 好 ,这 时 候 就 值得 研究 了 : 大 脑 是 怎样 对 它们 进行 信 
息 加 工 , 从 而 得 出 这 两 种 不 同 的 语义 解释 的 。 因 为 从 常识 上 看 ,房子 
和 箱子 都 是 三 维 的 ,都 是 有 面积 和 体积 可 言 的 ;但 是 “房子 大 ”得 出 来 
的 语义 解释 是 { 房 子 的 面积 大 } ,而 “箱子 大 ”得 出 来 的 语义 解释 是 { 箱 
子 的 体积 大 } 。 搞 心理 学 的 人 就 要 研究 它 ,要 追究 人 的 脑子 里 面 有 哪 
些 心理 结构 和 认 知 结构 ,经 过 了 怎样 的 认 知 加 工 过 程 , 才 能 达到 这 公 
一 种 语义 理解 。 作 为 一 个 搞 人 工 智 能 的 人 ,他 关心 的 是 这 人 么 一 个 语 
言 理 解 过 程 ,怎样 用 一 套 形式 化 的 规则 把 它 表 示 出 来 ,建立 一 个 可 计 
算 的 数学 模型 ,然后 让 机 器 去 模拟 ,并 通过 程序 在 机 器 上 实现 这 样 的 
理解 。 如 果 说 他 的 机 器 是 一 个 具有 智能 的 机 器 ,对 语言 有 很 好 的 理 
解 能 力 的 话 ;那么 给 它 输 入 “房子 大 ”, 输 出 的 语义 理解 应 该 是 { 房 子 
的 面积 大 }, 而 不 是 { 房 子 的 体积 大 } 。 如 果 做 不 到 这 一 点 ,说 明 这 人 台 
机 器 还 不 够 智能 化 ,甚至 是 没有 智能 的 。 人 脑 里 面 到 底 有 什么 样 的 
认 知 结构 ,通过 什么 样 的 认 知 过 程 来 完成 这 么 一 个 解决 问题 的 任务 ? 
我 们 认为 大 脑 中 的 认 知 结构 是 一 个 网 络 式 的 结构 ,也 就 是 说 ,语义 在 
大 脑 中 的 储存 是 以 一 种 网 状 的 方式 。 而 不 是 像 传 统 上 那样 ,认为 大 
脑 中 有 一 部 心理 词典 ,这 种 心理 词典 中 储存 一 套 词 汇 ,这些 词 汇 表现 
为 一 条 一 条 离散 的 词 项 ,它们 以 声音 或 意义 等 线索 编排 在 一 起 。 相 
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反 ,现在 我 们 更 相信 大 脑 中 的 心智 词典 是 一 种 由 语义 结 点 构成 的 网 
络 。 当 你 听 到 一 个 词 时 , 它 激 活 (activate) 了 网 络 上 的 一 片 相 关 的 语 
义 结 点 。 比如 ,我们 可 以 这 样 来 表示 “房子 大 "与 “箱子 大 ”的 语义 理 
解 过 程 : 


{ 房 子 的 面积 大 } 
房子 大 
输入 输出 
{ 箱 子 的 体积 大 } 


一 个 人 听 到 “房子 ?和 “箱子 ”的 时 候 ,脑子 里 至 少 激活 了 [面积 ] 和 [ 体 
积 ] 这 样 两 个 语义 结 点 ;同时 “大 ”可 以 指 体积 大 ,也 可 以 指 面积 大 ,还 
可 以 指数 量 大 ,甚至 可 以 指 力量 大 、 能 力 大 、 重 量 大 ……。 有 了 这 样 
一 个 网 络 , 能 不 能 给 出 一 种 有 效 的 计算 方法 ,使 我 们 听 到 “房子 大 ” 
时 ,把 [房子 > 面积 > 大 ]~>{ 房 子 的 面积 大 } 这 条 语义 路 线 接 通 ; 听 到 
“箱子 大 ”时 ,把 [箱子 -> 体积 ~ 大 ]-~{ 箱 子 的 体积 大 } 这 条 语义 路 线 
接 通 。 其 实 , 我 们 听 到 “房子 大 ”后 ,除了 激活 [面积 ][ 体 积 ] 这 两 个 
语义 结 点 之 外 ,还 有 另外 一 些 语义 结 点 ,如 房子 是 供 [住人 ] 用 的 ,而 
箱子 是 供 [ 装 物 ] 用 的 。 而 [住人 ] 和 [面积 ] 存 在 着 相互 作用 的 关系 ， 
[体积 ] 与 [ 装 物 ] 之 间 也 有 相互 作用 的 关系 。 正 是 通过 语义 结 点 之 间 
的 相互 作用 关系 ,把 某 些 语义 结 点 强化 了 ,同时 把 另外 一 些 语义 结 点 
抑制 了 。 在 这 里 ,* 房 子 * 尽 管 激活 的 是 [面积 ] 和 [体积 ] 这 两 个 语义 
结 点 ,由 于 [住人 ] 这 个 语义 结 点 的 加 入 ,一 下 子 就 把 [面积 ] 这 个 语义 
结 点 的 权 值 Cweight) 加 重 了 ,所 以 [面积 ] 被 突显 成 为 强 特征 ,[ 体 积 ] 
被 压抑 成 为 弱 特 征 。 因 此 , 当 我 们 听 到 “房子 ?时 ,首先 想到 的 是 [ 面 
积 ] 这 个 特征 ;而 听 到 “箱子 ”的 时 候 , 由 于 [ 装 物 ] 这 个 特征 的 加 入 ,一 
下 子 把 [体积 ] 这 个 语义 结 点 的 权 值 加 重 了 。 在 “大 ”激活 的 几 个 语义 
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结 点 中 ， 房 子 ? 跟 “大 ”组合 的 时 候 , 就 遵循 一 种 基本 的 规约 : 主语 名 
词 的 强 特征 优先 与 谓语 形容 词 的 选择 特征 进行 匹配 ,其 他 特征 被 压 
抑 和 淘汰 ,最 后 输出 的 结果 便 是 { 房 子 的 面积 大 } 。 在 这 种 语义 网 络 
上 ， 经 过 推理 ,得 到 这 样 一 种 语义 解释 。 这 样 一 种 网 络 , 就 是 我 们 所 
谓 的 “ 认 知 结构 ”, 它 的 生物 基础 是 一 种 神经 网 络 系统 。 神 经 网 络 目 
前 在 人 工 智 能 研究 上 很 热 。 传 统 的 人 工 智 能 认为 ,我 们 处 理 问 题 是 
根据 一 条 条 规则 的 先后 顺序 来 进行 的 。 现 代 神 经 网 络 理论 认为 ,如 
果 是 那样 的 话 , 一 个 人 要 做 一 件 事情 就 根本 来 不 及 做 。 因 为 一 条 条 
规则 的 调动 要 按 先后 顺序 ,是 需要 相当 的 时 间 的 ;但 实际 上 人 们 做 事 
情 的 时 候 , 是 很 快 就 做 完了 的 ,不 可 能 有 那么 长 的 时 间 供 你 按部就班 
地 去 做 。 所 以 ,在 人 工 智 能 研究 中 ,许多 人 尝试 运用 神经 网 络 , 来 代 
替 传统 的 人 工 智 能 中 的 串 行规 则 。 上 面 讲 的 是 认 知 结构 ,下 面 我 们 
接着 讲 认 知 过 程 。 

人 类 的 认 知 过 程 在 许多 情况 下 是 一 个 推理 的 过 程 ,其 中 经 常用 
到 的 一 种 推理 叫做 “ 缺 省 推理 ”(reasoning by default) 。 这 种 推理 形 
式 生 活 中 比比 皆 是 ,但 传统 的 逻辑 一 般 不 研究 它 。 因 为 它 具 有 非 单 
调 性 的 (non-monotonous) 特 点 ,表现 为 一 组 前 提 及 由 其 推出 的 一 组 
结论 ,有 可 能 是 不 一 致 的 ,会 违反 逻辑 上 的 排 中 律 。 直 到 计算 机 科学 
上 的 人 工 智 能 兴起 , 才 研 究 这 种 逻辑 。 通 俗 地 说 ,这 种 基于 缺 省 推理 
的 非 单调 逻辑 的 要 义 是 : 在 一 般 的 日 常生 活 中 ,人 们 可 以 假定 某 些 
命题 总 是 正确 的 ,除非 有 特别 的 关于 例外 的 声明 。 比 如 , 甲 对 乙 说 : 
“我 要 送 你 一 只 小 猫 ”, 第 二 天 , 甲 真 的 拿 来 一 只 小 猫 , 但 却 是 一 只 死 
猫 。 这 时 乙 当 然 会 不 高 兴 , 你 说 要 给 我 一 只 小 猫 ,为 什么 给 我 一 只 
死 猫 ?? 于 是 , 甲 就 申辩 说 “我 可 没有 说 过 要 给 你 的 猫 是 死 的 还 是 活 
的 , 猫 可 以 是 活 的 ,也 可 以 是 死 的 .” 问 题 出 在 哪里 ? 问题 在 于 : 作为 
日 常 的 语言 交际 ,我 们 有 一 些 心 照 不 宣 却 必 须 遵 守 的 规约 (conven- 
tion), 这 种 约定 是 不 用 说 出 来 的 ,但 又 是 大 家 心 知 肚 明 、 不 可 违反 
的 。 比 如 ,说 给 人 一 只 猫 或 鸟 ,肯定 是 活 的 ;如 果 是 死 猫 或 死 鸟 的 话 ， 
那么 就 必须 事先 声明 : “ 那 可 是 一 只 死 猫 唉 ,你 爱 要 不 要 。” 这 是 一 种 
交际 常规 (communication regulation) 。 这 种 推理 方式 不 光 在 日 常生 
活 中 管用 ,就 是 在 法 庭 上 也 是 有 效 的 。 比 如 “人 工 智 能 ”一 词 的 创造 
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者 .斯 坦 福 大 学 的 McCarthy 教授 举 了 这 样 一 个 例子 : 一 个 主人 请 了 
一 个 木匠 给 他 做 一 个 养 鸟 的 棚 。 做 完 以 后 ,主人 拒绝 付 钱 , 理 由 是 : 
你 给 我 盖 的 鸟 含 是 有 棚 顶 的 ,而 我 要 养 的 是 一 只 能 乌 ,根本 用 不 着 这 
个 棚 顶 ,能 鸟 又 不 会 飞 , 所 以 拒绝 付 工 资 。 结 果 争 执 不 下 ,就 告 上 了 
法 庭 。 法 庭 判 木匠 胜诉 ,因为 如 果 你 养 的 是 一 只 能 乌 , 不 要 棚 顶 , 那 
入 你 就 应 当 事 先 声明 。 的 确 , 一 般 人 听 到 乌 , 总 是 会 想到 它 会 飞 ; 也 
就 是 说 ,[ 会 飞 ] 是 鸟 的 缺 省 性 特征 ,是 不 用 特别 说 明 的 。 

同样 , 当 我 们 说 “房子 大 ”的 时 候 ,[ 面 积 ] 这 个 特征 是 缺 省 的 ; 当 
我 们 说 “箱子 大 ”的 时 候 ,[ 体 积 ] 这 个 特征 是 缺 省 的 。 当 我 要 表达 房 
子 的 体积 大 的 意思 时 ,房子 的 “体积 "这 个 词 就 不 能 省 略 。 如 “这 座 房 
子 的 体积 真 大 ,可 以 用 来 堆放 棉花 "中 ， 体 积 ” 这 个 词 一 般 不 能 省 
略 , 因 为 [体积 ] 不 是 “房子 ”的 一 个 强 特征 。 也 就 是 说 ,[ 体 积 ] 昌 然 是 
房子 的 一 个 特征 ,但 不 是 房子 的 缺 省 特征 , 它 是 一 个 有 标记 的 特征 
Cmarked feature) ,一 定 要 说 出 来 。 同 样 的 道理 , 当 我 们 要 说 “箱子 的 
面积 大 ”时 ,箱子 的 “面积 "这 个 词 是 不 能 省 略 的 。 这 种 推理 方式 就 是 
缺 省 推理 : 只 有 强 特 征 的 词汇 表达 才能 作为 缺 省 的 词 , 而 弱 特 征 的 
词汇 表达 是 不 能 作为 缺 省 的 词 的 。 所 以 人 在 进行 语义 理解 时 就 是 在 
这 样 一 种 神经 网 络 . 这样 一 种 认 知 结构 上 进行 这 样 一 种 缺 省 的 推理 
过 程 。 揭 示 这 样 一 种 过 程 , 实 际 上 就 是 揭示 语义 理解 的 微观 的 心理 
机 制 和 逻辑 机 制 ,并 为 语义 理解 提供 了 一 种 可 计算 的 逻辑 模型 。 我 
的 这 一 工作 ,发表 在 4 中国 语文 1994 年 第 4 期 上 ,名 为 《一 价 名 词 的 
认 知 研究 》。 后 来 清华 大 学 计算 机 系 的 一 位 博士 后 研究 人 员 ,根据 这 
个 思想 做 了 一 个 语义 理解 模型 。 他 告诉 我 做 得 很 好 ,机 器 上 可 以 运 
转 和 验证 。 他 还 写 了 一 篇 文章 ,发 表 在 新 加 坡 的 一 个 杂志 上 。 

这 是 一 种 很 有 意思 的 工作 ,我 们 还 可 以 用 它 来 研究 其 他 一 些 相 
关 的 问题 。 比 如 : 

(3) 这 酒 很 火 。{ 味 道 淡 > 颜色 淡 } 
(4) 这 花 很 淡 。({ 颜 色 淡 之 味道 淡 } 

它们 的 意思 不 一 样 。 说 “这 酒 很 淡 ”, 只 能 是 指 这 酒 的 味 儿 很 淡 ; 说 
“这 花 很 淡 ”, 只 能 是 指 这 花 的 颜色 很 淡 。 如 果 我 们 认真 地 想 一 想 ,就 
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会 觉得 酒 也 有 颜色 ;但 是 , 当 我 们 要 表达 { 这 酒 颜色 很 淡 } 这 种 意思 
时 ， 颜 色 ” 这 个 词 是 不 能 省 略 的 ,一 定 要 老 老 实 实 地 说 “这 酒 颜色 很 
淡 , 但 是 喝 起 来 很 冲 ,味道 很 浓 ”。 同 样 ,如 果 要 表达 { 这 花 的 味 儿 淡 ) 
这 种 意思 时 ， 味 儿 ” 这 个 词 也 是 不 能 省 略 的 ,一 定 要 老 老 实 实地 说 
“这 花 儿 味 儿 很 淡 , 虽 然 看 上 去 很 艳 ,颜色 很 浓 ”。 为 什么 ? 我 们 可 以 
用 刚才 说 的 那 一 套 办 法 和 概念 ,就 是 语义 网 络 、 扩 散 性 激活 、 缺 省 推 
理 等 来 解释 。 它 还 能 解释 一 批 其 他 相关 的 复杂 的 语言 现象 ,涉及 到 
人 类 处 理 语 言 形 式 和 意义 、 看 到 的 语言 形式 和 脑子 里 想到 的 意义 之 
间 的 关系 的 微妙 复杂 的 机 制 。 这 些 问 题 如 果 用 传统 的 理论 就 不 好 解 
释 。 现 在 我 们 从 认 知 心理 学 .从 计算 机 科学 的 角度 来 研究 这 些 问 题 ， 
就 不 光 能 得 到 一 个 很 好 的 解释 ,并 且 形 式 化 的 程度 很 高 ,刚才 那些 认 
识 可 以 用 一 些 产生 式 规 则 (production rule) 来 描述 ,从 而 可 以 算法 
化 ,并 通过 程序 语言 在 机 器 上 实现 。 

从 这 里 我 们 看 到 ,语言 学 研究 一 定 要 面向 当代 的 科学 技术 ,这 样 
才能 获得 有 用 的 概念 和 合适 的 研究 方法 ;同时 ,这 种 研究 结果 才能 真 
正 为 现代 科技 服务 。 这 是 一 种 语言 研究 和 当代 科技 的 双向 互动 ,而 
不 仅仅 是 单纯 的 语言 研究 。 


2 语义 泪 算 和 名 词 配 价 


下 面 讲 第 二 个 案例 ,关于 语义 演算 的 问题 。 

这 个 问题 很 早 以 前 就 是 一 些 哲 学 家 、 数 学 家 、 逻 辑 学 家 非常 关注 
的 。 他 们 和 希望 通过 一 些 像 数 学 演算 一 样 的 方法 ,来 证 明 这 些 句 子 是 
可 以 说 的 、\ 那 些 句子 是 不 能 说 的 ,这 个 句子 是 有 意义 的 、 那 个 句子 是 
没有 意义 的 。 比 如 : 


GD 于 更 区 十 
要 判断 这 个 句子 到 底 有 没有 意义 ,如 何 判断 ? 逻辑 学 家 说 ,有 无 意义 
的 问题 就 是 有 无 真 值 的 问题 。 说 一 个 陈述 有 真 值 ,就 是 说 这 个 陈述 
是 可 以 判断 真 假 的 。 那 么 ,如 何 来 演算 呢 ? 这 就 首先 要 引入 一 些 范 
畴 表达 式 ,把 句子 中 的 词 项 及 其 语法 关系 进行 形式 化 表示 。 我 们 用 
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e 来 代表 “ 王 冕 ”的 所 指 (e 是 英语 entity 的 缩写 ,表示 实体 ), 把 “ 死 ? 
的 意义 表示 为 人 et?, 即 从 e 到 ft 的 一 个 函数 Mt 是 英语 truth 的 缩 
写 ,表示 真 值 ) 。 体 态 助 词 “ 了 ”暂时 不 考虑 。 这 样 的 符号 表示 ,对 大 
家 来 说 可 能 不 好 理解 。 现 在 ,我 们 牺牲 掉 一 点 精确 性 ,尽量 把 它 说 得 
直观 一 些 :“ 死 "这 个 词 本 身 表 示 的 意义 是 没有 什么 真 假 可 言 的 ,只 有 
当 引 入 一 个 实体 词 跟 它 组 合 时 ,才能 判断 由 它 组 成 的 这 个 陈述 是 真 
是 假 , 这 就 是 函数 表达 式 (e,t) 的 含义 。 比 如 , 光 说 “ 死 ”你 不 知道 其 
真 假 ; 只 有 说 “ 张 三 死 了 ”“ 李 四 死 了 ”时 ,才能 知道 这 个 陈述 是 真是 
假 ,单独 一 个 动词 “ 死 ? 就 无 所 谓 真 假 。 拿 “ 王 冕 死 了 ”这 个 句子 来 说 ， 
假如 “ 王 冕 ?是 现实 生活 或 某 个 可 能 世界 (possible world) 中 的 某 一 
个 人 ;在 现实 生活 或 这 个 可 能 世界 中 ,如 果真 的 王 冕 死 了 ,那么 这 名 
话 就 是 真 的 ;如 果 王 网 没有 死 , 那 么 这 句 话 就 是 假 的 。 不 管 是 真是 
假 , 这 句 话 都 是 有 意义 的 。 如 果 一 个 句子 说 出 来 后 不 能 判断 它 的 真 
假 ,那么 这 个 句子 就 是 没有 意义 的 。 这 种 逻辑 就 是 逻辑 学 家 蒙 塔 古 
(Richard Montague) 的 内 涵 逻 辑 (intensional logic) 。 在 这 种 逻辑 体 
系 下 ,*“ 王 冕 ?属于 范畴 (e)“ 死 了 ”属于 范畴 (e,t), 于 是 ， 王 冕 死 了 ” 
可 以 通过 逻辑 演算 来 看 它 有 没有 意义 ( 即 真 值 ) 。 例 如 : 
生 泥 -死相 
人 CS》 《St 
二 

把 两 个 范畴 表达 式 中 的 e 约 分 以 后 ,最 后 剩 下 的 结果 是 t, 说 明 这 个 
句子 是 有 真 值 的 。 我 们 可 以 把 范畴 表达 式 (e,t 解 释 为 : 它 是 一 种 
小 型 的 计算 装置 ,只 有 向 它 输入 一 个 实体 e, 它 才能 输出 一 个 真 值 t。 
这 里 正好 有 实体 词 “ 王 冕 ?出现 , 所 以 约 分 以 后 得 t, 就 是 说 这 个 句子 
是 可 以 判断 是 真 或 假 的 。 这 就 是 蒙 塔 古语 法 的 演算 方式 ,非常 严格 、 
非常 精致 .非常 漂亮 。 问 题 是 ,这 套 办 法 拿 到 汉语 中 来 后 ,对 有 些 句 
子 是 不 大 好 处 理 的 。 比 如 : 


(2) 王 晃 七 岁 上 死 了 父亲 。 


死 的 不 是 王 冕 ,而 是 他 父亲 ,能 不 能 再 用 上 面 那 套 办 法 来 推导 ? 不 好 
推导 。 如 果 这 样 计 算 : 
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王 冕 父亲 死 了 
人》(，t》《(e》 


上 
寺 


t 和 ee 对 不 起 来 , 剩 下 的 不 好 处 理 。 如 果 先 算 后 面 的 两 个 范畴 
也 一 样 : 


王 晃 死 了 父亲 
《es t》《〈 导 
ft 


7 


也 没有 真 值 。 但 上 面 这 句 话 却 肯定 是 合 语法 、 可 接受 ,并 且 是 有 
意义 的 。 怎 么 办 ? 原来 “父亲 ”这 类 词 不 能 简单 地 跟 “ 王 网 ?等 同 起 来 
作为 一 个 实体 ,这 是 不 对 的 。 因 为 “父亲 ?是 一 个 关系 词 , 单 说 “父亲 ?” 
是 没有 所 指 的 ,一 定 要 说 成 “小 王 的 父亲 (是 指 老 王 )“ 小 张 的 父亲 ” 
〈 是 指 老 张 ) 之 类 的 形式 ,才能 获得 所 指 意义 。 所 以 “父亲 ?不 能 这 样 
简单 地 用 范畴 表达 式 (e? 来 刻画 。 我 们 给 这 类 名 词 取 一 个 名 称 , 叫 做 
“一 价 名 词 ”。 意 思 是 , 它 需要 一 个 配 价 成 分 跟 它 组 合 ,才能 有 真正 的 
所 指 。 在 语言 中 ,大 多 数 名 词 是 零 价 的 ,不 需要 配 价 成 分 。 少 数 名 词 
是 一 价 的 ,需要 一 个 配 价 成 分 ,比如 "尾巴 、 抽 屠 ” 等 ,都 需要 另外 一 个 
名 词 跟 它 配合 ,说 成 “狐狸 的 尾巴 书桌 的 抽 屠 ”等 ,才能 有 语义 所 指 。 
还 有 少数 是 二 价 的 ,需要 两 个 配 价 成 分 比如“ 意见、 感情" 等 ,都 需要 
两 个 名 词 跟 它 配 合 , 说 成 “学 生 对 老师 的 意见 .大 李 对 刘 芳 的 感情 ” 
等 ,才能 有 语义 所 指 。 在 上 例 中 “父亲 ?是 个 一 价 名 词 , 它 需 要 另外 
一 个 实体 词 的 出 现 , 才 能 有 所 指 。 所 以 这 里 应 当 把 它 表 示 成 一 个 函 
数 式 (e, e) ,大 意 为 : 它 是 一 个 从 实体 到 实体 的 函数 。 直 观 的 理解 可 
以 是 : 这 种 词 表面 上 看 起 来 好 像 表 达 一 个 实体 ,其 实 这 是 一 种 抽象 
实体 , 它 一 定 要 另外 一 个 实体 出 现时 ,才能 有 所 指 ,才能 真正 表示 可 
能 世界 或 现实 生活 中 的 某 一 个 人 、 某 一 个 事物 ,等 等 。 比 如 , 光 说 “ 哥 
哥 ””“ 父 亲 ” 是 没有 所 指 的 ,不 知道 是 谁 , 一 定 要 说 “ 谁 的 哥哥 ”“ 谁 的 
父亲 " 才 行 。 所 以 它 是 一 个 (e，e? 式 的 函数 。 这 样 一 来 ,上 例 的 语义 
演算 就 好 处 理 了 。 例 如 : 
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王 晃 死 了 父亲 
(&》( 必 te》 


《 亲 
生 


上 述 约 分 表达 式 , 可 以 这 样 来 直观 地 理解 :“ 死 了 ” 跟 * 父 亲 ? 先 组 
合 , 各 消 掉 一 个 实体 以 后 ,整个 “ 死 了 父亲 ?在 功能 上 相当 于 一 个 不 及 
物 动 词 , 仍 需要 另外 一 个 实体 词 填 人 ,才能 构成 一 个 可 以 判断 其 真 假 
的 陈述 。 当 然 , 这 是 一 种 大 概 的 设想 。 从 逻辑 技术 上 讲 , 其 中 的 贴 合 
运算 的 步骤 和 规则 等 细节 ,还 尚 待 作 出 进一步 的 研究 。 这 样 ， 王 网 
死 了 父亲 ”是 有 真 值 可 言 的 。 不 管 它 是 真是 假 , 这 个 句子 是 有 意义 
的 。 这 就 是 一 种 语义 的 演算 。 但 这 是 简单 的 ,还 有 复杂 的 ,比如 在 上 
例 中 加 上 一 个 副词 “刚刚 ”, 说 成 “ 王 冕 刚刚 死 了 父亲 ”, 你 就 得 引 和 更 
为 复杂 的 演算 规则 。 如 果 所 有 的 句子 都 能 够 用 这 种 办 法 来 演算 的 
话 , 那 机 器 完全 可 以 根据 这 种 办 法 来 自动 地 推导 : 一 查 词典 ， 父 亲 ” 
是 这 样 一 种 范畴 ,然后 自动 给 它 标 上 相应 的 范畴 表达 式 , 再 对 有 关 词 
语 的 范畴 表达 式 进 行 自动 演算 ,就 可 以 自动 判断 句子 是 有 意义 的 还 
是 无 意义 的 。 能 按照 规则 推出 t 的 句子 ,就 是 有 意义 的 ;不 能 按照 规 
则 推出 t 的 句子 ,就 是 没有 意义 的 。 

这 是 用 现代 逻辑 的 方法 来 研究 语言 ,这 种 方法 对 机 器 处 理 语言 
比较 有 用 。 我 的 同学 白 硕 在 中 科 院 计算 所 工作 ,他 基本 上 就 是 用 这 
种 办 法 建造 了 一 个 句子 意义 的 演算 系统 ,希望 用 于 信息 检索 ,快速 查 
找 等 语言 信息 处 理工 程 。 在 他 的 演算 系统 中 , 他 采纳 了 我 提出 的 关 
于 名 词 配 价 的 有 关 思 想 。 这 对 语言 学 者 来 说 ,是 比较 兴奋 的 一 件 事 。 

以 上 两 个 案例 听 起 来 是 比较 费 脑 子 的 ,下 面 我 们 来 两 个 轻松 一 
点 儿 的 。 


3 ”范畴 辨认 和 词类 划分 


第 三 个 案例 ,范畴 的 辨认 。 

生活 中 需要 辨别 “类 ? 跟 实 体 的 关系 。 哪 些 实体 可 以 归 和 一 个 
类 ,哪些 不 能 归 入 一 个 类 ,这 就 叫 范畴 的 辨认 。 心 理学 家 很 关心 这 人 么 
一 个 问题 ,做 了 很 多 实验 。 我 们 用 它 来 研究 汉语 的 词类 。 在 座 的 各 
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位 可 能 都 有 这 样 一 种 经 历 : 买 一 本 《现代 汉语 词典 》 回 来 , 翻 开 来 一 
看 ,发 现 词 典 上 没有 标 名 词 ,动词 ,形容词 等 词类 ,顿时 觉得 很 遗憾 。 
相应 地 ,你 买 一 本 再 小 的 英语 词典 ,上 面 都 标明 verb 或 者 noun .ad- 
jective。 为 什么 汉语 词典 不 标 词类 ? 是 不 是 汉语 的 词 没 有 词类 ? 不 
管 你 回答 “是 ?还 是 “不 是 ”, 都 需要 证 明 。 我 们 不 妨 先 假定 汉语 的 词 
没有 词类 。 我 的 同学 白 硕 曾 经 这 样 论证 过 : 如 果 说 汉语 没有 词类 ， 
那么 从 逻辑 或 数学 的 角度 看 ,只 能 有 这 样 两 种 情况 ， 

第 一 种 可 能 性 是 : 所 有 的 词 都 是 一 个 类 ,没有 分 别 。 假 设 有 A、 
B、C 任意 三 个 汉语 的 词 , 如 果 没 有 词类 分 别 , 那 么 在 下 面 这 个 句子 框 
架 中 ， 


Rb 


A 就 既 可 以 出 现在 a 的 位 置 上 ,也 可 以 出 现在 b 的 位 置 上 ,也 可 以 出 
现在 的 位 置 上 ;BC 也 都 可 以 出 现在 ab,c 三 个 位 置 的 任意 一 个 
位 置 上 。 就 是 说 ,任何 一 个 词 都 可 以 出 现在 句子 的 任何 一 个 位 置 上 。 
这 种 情况 是 不 符合 汉语 的 实际 的 ,我 们 明显 地 感 党 到 “的 >“ 着 ”、 
“了 ”这 样 一 些 词 总 是 出 现在 其 他 成 分 的 后 面 ; 而 “把 ”>“ 被 >“ 也 ”这 
样 一 些 词 总 要 加 在 某 些 成 分 的 前 面 。 由 此 可 见 ,第 一 种 假设 是 不 成 
立 的 。 

第 二 种 可 能 性 是 : 所 有 的 词 都 两 两 相 异 ,各 不 相同 , 谁 跟 谁 都 不 
一 样 。 因 为 每 一 个 词 都 自 成 一 类 ,所 以 也 无 词类 可 言 。 但 这 也 不 符 
合 语言 事实 。 例 如 : 

全 各 


在 这 个 空格 中 可 以 加 “了 ”“ 着 ”“ 过 ”, 至 少 这 三 个 词 是 一 个 类 。 这 
样 看 来 ,汉语 的 词类 也 不 可 能 是 这 种 情况 。 

我 们 排除 了 上 面 两 种 假设 ,那么 汉语 的 词类 就 应 该 是 有 的 了 。 
下 面 我 们 来 讨论 汉语 有 词类 的 情况 。 

我 们 首先 会 想到 名 词 \ 动 词 .形容 词 , 但 问题 是 ,我 们 有 没有 办 法 
来 准确 地 识别 哪些 词 是 名 词 ,哪些 词 是 动词 ,哪些 词 是 形容 词 ? 这 种 
办 法 还 是 有 的 。 自 从 结构 主义 在 上 个 世纪 二 三 十 年 代 兴 起 以 来 , 形 
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成 了 一 种 分 布 分 析 (distribution analysis) 方 法 。 有 些 词 如 果 所 处 的 
句法 位 置 是 一 样 的 ,那么 它们 是 一 个 类 。 比 如 有 几 个 词 既 能 作 主 语 ， 
还 能 作 宾 语 定语, 这些 词 就 是 一 个 类 ,叫做 名 词 。 有 的 词 能 够 做 谓 
语 ,一 般 不 能 直接 单独 作 主 语 、 宾 语 、 定 语 , 这 些 词 可 以 叫 动词 。 这 种 
分 析 方 法 就 叫做 分 布 分 析 。 严 格 地 讲 , 用 分 布 分 析 划 分 词类 时 ,应 该 
考虑 一 个 词 在 语法 上 的 全 部 分 布 (total distributions); 只 有 全 部 分 
布 都 相同 的 词 才 能 归 为 一 类 。 但 是 ,一 个 词 的 所 有 的 分 布 太 复杂 \ 不 
容易 穷尽 ,并 且 真 正 全 部 分 布 都 一 样 的 词 是 不 多 的 。 那 么 简单 化 一 
些 , 怎 么 办 呢 ? 我 的 老师 朱德 四 先生 的 做 法 是 : 找 一 些 关键 的 特征 ， 
即 一 些 区 别 特 征 ,利用 这 些 特 征 之 间 的 合 取 或 析 取 关 系 , 作 为 划分 词 
类 的 标准 。 根 据 他 的 说 法 ,名 词 是 适合 于 下 列 分 布 框架 的 一 类 词 : 


NSTD 


即 它 通常 受 数量 词 ( 记 作 SL) 的 修饰 ,同时 不 能 受 副 词 ( 记 作 F) 修 
饰 。 比 如 ,不 能 说 “很 桌子 *“ 太 桌子 ”。 这 就 是 找 出 了 具有 区 别 性 的 
分 布 特征 。 这 个 办 法 非常 好 ,动词 ,形容词 也 可 以 用 这 种 区 别 性 的 分 
布 特征 来 划分 。 这 种 方法 在 原则 上 可 以 对 汉语 的 词类 问题 进行 很 好 
的 处 理 , 但 还 是 有 很 多 问题 不 能 很 好 地 解决 ,比如 说 ,有 些 词 ,在 感觉 
上 完全 是 一 个 名 词 ,可 是 它 适 应 不 了 这 个 框架 。 比 如 “体育 ”“ 皮 
肤 "。“ 一 项 体育 ”说 不 说 ? 不 说 。“ 一 个 体育 ”也 不 说 。“ 皮 肤 ? 呢 ? 
说 “一 块 皮肤 ”的 可 能 性 很 小 很 小 ,不 是 完全 没有 可 能 ,外 科大 夫 有 可 
能 在 手术 室 里 说 “一 块 皮肤 ”。 一 般 情况 下 ,皮肤 > 也 不 受 数量 结构 
修饰 。 按 照 朱 先 生 的 这 个 框架 ,就 把 它们 从 名 词 中 排除 出 去 了 。 但 
我 们 却 能 明显 地 感到 “体育 ”和 “皮肤 ”肯定 是 名 词 。 如 果 “ 桌 子 、 椅 
子 是 名 词 的 话 ,那么 “体育 .皮肤 ”也 应 该 是 名 词 。 看 来 ,这 一 套 办 法 
要 受到 怀 括 : 分 布 分 析 ,或 者 找 区 别 特征 的 办 法 可 靠 性 到 底 有 多 大 ? 
能 解决 多 少 问题 ?更 为 极端 的 想法 就 会 怀疑 : 汉语 的 词 到 底 能 不 能 
分 出 词类 来 ? 汉语 到 底 有 没有 词类 这 种 语法 范畴 ? 

我 们 从 认 知 心理 学 的 范畴 辨认 方面 来 分 析 它 。 下 面 我 们 先 不 考 
虑 词类 ,而 是 考虑 日 常生 活 中 的 问题 。 比 如 说 蔬菜 \ 水 果 的 分 类 。 现 
在 我 们 要 想 一 个 办 法 , 找 出 一 个 定义 来 ,什么 是 蔬菜 ,什么 是 水 果 ? 
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并 且 根 据 这 个 定义 ,把 应 该 属于 水 果 的 , 归 人 水果, 把 应 该 属于 蔬菜 
的 , 归 人 和 人 蔬菜。 能 不 能 ? 比如 说 ,水 果 是 木 本 植物 的 果实 ,可 以 直接 
吃 的 ;蔬菜 是 草本 植物 , 炒 了 以 后 才能 吃 的。 这 样 下 定义 行 不 行 ? 好 
像 不 行 。 因 为 甘蔗 也 是 水 果 ,但 它 不 是 木 本 植物 的 果实 ;草莓 也 不 是 
木 本 植物 ,但 它 却 是 水 果 。 但 是 我 们 会 不 会 怀疑 蔬菜 和 水 果 这 种 区 
分 是 无 效 的 呢 ? 或 者 声称 : 根本 就 没有 蔬菜 水果 这 种 分 类 。 显 然 
不 会 。 那 么 ,为 什么 我 们 刚才 会 怀疑 名 词 动词 ,形容词 这 些 范畴 的 
存在 ,而 现在 却 不 怀疑 水 果 与 蔬菜 是 两 个 客观 存在 的 范畴 呢 ? 我 们 
是 经 过 了 哪些 认 知 的 操作 来 做 到 认识 哪些 东西 是 蔬菜 ,哪些 东西 是 
水 果 的 呢 ? 这 是 搞 心 理学 的 人 很 关心 的 问题 。 有 的 人 想 , 只 要 狗 而 
不 舍 地 追 下 去 ,总 能 找到 一 些 特征 ,把 它们 分 开 。 是 蔬菜 的 东西 二 定 
有 一 些 共同 的 特征 ,这 些 特征 是 那些 叫 水 果 的 东西 所 没有 的 ;同样 ; 
叫 水 果 的 那些 东西 也 一 定 有 一 些 共同 的 特征 ,这 些 特征 是 那些 叫 蔬 
菜 的 东西 所 不 具有 的 。 有 人 是 这 么 相信 的 ,但 始终 没有 找到 这 种 区 
别 性 特征 。 找 不 到 的 话 , 那 就 应 该 怀疑 ,到 底 有 没有 这 种 特征 ? 我 们 
倾向 于 认为 没有 。 没 有 的 话 , 又 怎么 来 划分 呢 ? 这 里 面 涉及 到 分 类 
的 理论 , 即 范畴 化 (categorization) 理 论 。 上 面 这 种 分 类 的 概念 ,其 前 
提 是 认为 : 对 事物 的 分 类 、 把 事物 归 和 人 某 一 个 范畴 里 去 ,根据 的 是 事 
物 的 特征 ;这 个 特征 是 一 种 充分 必要 条 件 , 是 这 个 范畴 的 成 员 一 定 要 
具有 这 个 特征 ,并 且 不 属于 这 个 范畴 的 东西 一 定 不 具有 这 个 特征 。 
这 是 一 种 “是 ?或 “ 否 ” 的 简单 的 特征 分 类 。 根 据 特征 分 类 得 出 来 的 范 
畴 是 特征 范畴 ,数学 上 的 很 多 范畴 都 是 特征 范畴 。 比 如 说 奇数 和 偶 
数 , 那 是 很 清楚 的 ,如 果 偶 数 ,一 定 能 被 2 整除 ;如 果 奇数 ,肯定 不 能 
被 2 整除 ,很 清楚 。 又 如 素数 ,必定 只 能 被 1 和 它 本 身 整 除 ,是 这 个 
范畴 的 ,一 定 有 这 个 特征 ;不 是 这 个 范畴 的 ,一 定 不 具有 这 个 特征 : 
那么 ,汉语 的 词类 是 不 是 属于 特征 范畴 呢 ? 不 是 。 用 这 种 特征 分 类 
来 分 词类 ,就行 不 通 。 我 们 下 面 考察 蔬菜 、 水 果 这 种 类 是 怎么 分 出 来 
的 。 

认 知 心理 学 认为 ,蔬菜 和 水 果 的 分 类 是 根据 一 种 原型 分 出 来 的 ， 
这 种 范畴 叫做 典型 范畴 或 原型 范畴 (prototypical category)。 它 的 
意思 是 : 在 构成 这 个 范畴 的 众多 成 员 中 有 一 批 成 员 是 核心 的 成 员 
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( 即 原 型 ) ,这 些 成 员 都 具有 某 个 区 别 于 其 他 范畴 的 共同 特征 。 其 他 
的 成 员 是 边缘 性 的 成 员 ,它们 是 通过 与 典型 成 员 相 比较 ,根据 它 与 典 
型 成 员 的 相似 性 来 归 人 的 。 所 以 一 个 范畴 里 面 可 以 分 成 典型 成 员 和 
非典 型 成 员 。 原 来 ,典型 的 水 果 确 实 是 木 本 植物 的 果实 ,并 且 确 实 是 
可 以 拿 来 就 吃 的 ;其 他 的 一 些 成 员 跟 它 类 比 ,或 者 是 拿 来 就 可 以 吃 
的 ,或 者 是 木 本 植物 的 果实 ,或 者 有 其 他 一 些 共同 因素 ,通过 比较 类 
比 的 方法 归 进 来 的 。 典 型 的 蔬菜 是 草本 植物 , 炒 了 以 后 才 可 以 吃 , 如 
青菜 .菠菜 ,这 是 典型 成 员 ;其 他 有 些 成 员 根据 类 比 , 如 西红柿 ,就 是 
由 于 是 草本 植物 的 果实 而 归 入 蔬菜 的 。 如 果 跟 水 果 相 比 , 它 也 具有 
拿 来 就 能 吃 的 特点 ,因而 归 信 水果 也 可 以 ,所 以 西红柿 处 在 两 个 范畴 
的 交界 处 。 如 下 图 所 示 : A 是 蔬菜 ,B 是 水 果 。 〇 、`@ 是 苹果 ` 梨 等 ， 
甘蔗 则 处 在 @@ 的 位 置 ,@@ 是 西红柿 。 


用 这 个 思想 来 看 汉语 的 词类 ,我 们 就 豁然 开朗 了 。 为 什么 说 汉 
语 有 词类 , 却 又 分 不 清楚 ;说 它 没有 ,又 不 能 令 人 信服 ? 想 想 "桌子 ” 
肯定 是 名 词 “ 吃 ”肯定 是 动词 “好 ”“ 饱 ?肯定 是 形容 词 ,怎么 汉语 会 
没有 词类 呢 ? 肯定 有 。 要 说 有 ,可 是 又 分 不 开 来 。 问 题 在 于 原来 是 
用 “特征 范畴 ”这样 一 种 眼光 来 看 问题 的 , 戴 错 了 眼镜 ,所 以 看 东西 看 
不 清楚 。 现 在 有 了 典型 范畴 这 种 思想 ,我 们 就 可 以 用 它 来 看 这 个 问 
题 : 原先 朱 先 生 给 出 的 这 两 个 特征 ,我 们 可 以 把 它 看 成 是 名 词 的 典 
型 成 员 的 分 布 特征 ,其 他 成 员 跟 这 些 典 型 成 员 进行 类 比 , 相 似 性 比较 
多 的 话 , 算 作 名 词 , 比如 皮肤? 跟 * 体 育 ”, 都 不 能 作 谓 语 , 只 能 作 主 
语 、 宾 语 .定语 ;尽管 不 受 数量 结构 修饰 ,也 可 以 算 它 是 名 词 。 用 这 种 
新 的 眼光 来 看 ,那么 我 想 汉 语 的 词类 是 可 以 解决 的 。 我 这 套 思 路 提 
出 来 以 后 ,很 多 人 都 不 能 接受 ,觉得 总 是 把 握 不 准 。 后 来 我 有 个 同 
学 ,他 是 在 中 科 院 的 计算 所 工作 的 。 他 看 了 以 后 很 高 兴 , 说 在 计算 机 
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上 可 以 模拟 。 在 人 工 智 能 上 有 一 个 专门 的 学 科 , 叫做 Machine 
Learning, 即 机 器 学 习 ; 让 计算 机 跟 人 一 样 学 习 , 让 计算 机 更 加 聪明 。 
机 器 学 习 有 很 多 方法 ,其 中 有 一 种 叫做 “通过 类 比 的 学 习 ”(Learning 
by Analogy)。 用 这 套 方法 , 先 去 告诉 机 器 典型 的 名 词 有 哪些 特征 ， 
机 器 通过 类 比 学 习 , 可 以 把 名 词 ,动词 ,形容词 大 致 地 区 分 开 。 

讲 到 基于 类 比 的 学 习 ,我们 介绍 国外 人 工 智 能 界 做 的 一 些 工 作 : 
让 机 器 看 剧本 ,自动 地 找 出 哪些 是 喜剧 ,哪些 是 悲剧 。 如 何 实行 ? 先 
输入 罗密欧 与 朱丽叶 》 这 么 一 个 剧本 ,对 它 进 行 分 析 : 罗 与 朱 相 爱 ， 
感情 非常 真挚 而 且 异 常 强烈 ,然后 发 生 了 一 连 串 丢 又 烈 烈 的 家 族 争 
斗 , 结 局 是 有 情人 难 成 眷属 ,并 且 都 死 于 非 命 ,天 前 地 裂 之 后 白 茫 茫 
一 片 大 地 真 干净 。 研 究 者 根据 各 种 关系 制 成 图 形 ,表示 这 种 关系 并 
输入 机 器 。 接 下 来 再 输入 一 个 《奥赛 罗 》 的 故事 ,机 器 把 它 与 4 罗密欧 
与 朱丽叶 》 相 类 比 ,把 它 分 析 成 悲剧 。 科 学 家 还 让 机 器 去 自动 地 发 现 
欧姆 定律 。 先 教 机 器 去 分 析 一 个 水 管 , 把 流 过 一 段 水 管 的 水 流 的 速 
度 、 压 力 \ 摩 擦 力 等 参数 和 它们 之 间 的 关系 都 告诉 它 , 机 器 知道 了 这 
些 以 后 ,就 会 自动 地 类 推 : 电流 .电压 .电阻 是 否 也 有 这 种 关系 ? 如 
果 有 的 话 ,就 会 得 出 这 样 一 个 定律 。 这 样 ,机 器 就 像 人 一 样 地 发 现 了 
欧姆 定律 。 甚 至 有 更 极端 的 做 法 ,把 这 种 方法 推广 到 所 有 具有 线性 
的 约束 关系 的 系统 ,可 以 用 这 种 机 器 学 习 的 办 法 去 发 现 更 多 的 科学 
定律 。 我 们 的 研究 就 是 在 这 样 一 种 背景 下 进行 的 。 它 的 意义 和 价值 
不 光 是 语言 学 的 , 它 还 与 人 工 智 能 有 关 。 


4 认 知 策略 和 语序 排列 


最 后 讲 语序 排列 的 问题 。 我 们 也 从 认 知 的 角度 去 研究 它 。 先 看 
下 面 的 例子 : 
小 红 球 大 木 爹 小 黑 铁 塔 
关 红 小 球 关 木 大 爹 ” 关 黑 小 铁塔 
名 词 前 面 有 一 些 定语 ,它们 的 排列 是 有 规律 的 ,这 里 我 们 不 考虑 加 
“的 ”的 情况 。“ 红 球 ? 可 以 说 “小 球 ? 也 可 以 说 ,但 是 加 在 二 起 就 只 能 
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说 “小 红 球 ”, 不 能 说 “ 红 小 球 ”。“ 大 木 盆 "“ 小 黑 铁塔 "也 是 同样 的 情 
况 。 这 就 是 定语 的 一 种 排列 顺序 。 我 们 有 没有 可 能 把 这 种 规则 提取 
出 来 。 这 个 工作 其 实 十 几 年 前 就 有 人 做 了 ,直到 现在 还 不 容易 说 清 
楚 ,很 复杂 。. 我 们 假定 有 一 种 观察 方式 ,从 语义 上 来 考察 ,然后 给 出 
一 条 规则 ( 盖 表 示 “ 先 于 ”) : 


Ri : 尺寸 过 颜色 二 质料 


用 这 条 规则 来 解释 上 面 的 例子 ,是 可 以 控制 的 ;但 是 加 一 些 例子 进 
来 ,就 覆盖 不 住 了 。 比 如 ,农民 棉花 专家 ”, 不 能 说 “棉花 农民 专家 ”， 
这 里 面 又 有 它 自 己 的 规则 ,用 Ri 控制 不 了 。 再 如 “当代 青年 化 学 
家 ”,“ 当 代 ” 和 “青年 都 与 时 间 相关 ,但 两 者 的 次 序 是 固定 的 ,不 能 说 
“青年 当代 化 学 家 。” 可 见 Ri 很 直观 ,但 是 预测 能 力 很 差 ,不 能 解释 
更 多 的 问题 ,所 以 这 种 分 析 是 浅 层 次 的 分 析 。 到 目前 为 止 , 这 个 问题 
之 所 以 没有 能 很 好 地 解决 ,关键 在 于 大 家 的 眼光 始终 盯 在 意义 上 : 
“小 ?“ 大 ”表示 尺寸 ,“ 红 >“ 黑 表 示 颜 色 “ 木 >“ 铁 ”表示 质料 , 跳 不 
出 这 个 圈子 ,所 以 这 个 问题 解决 不 了 。 现 在 我 们 要 换 一 个 角度 来 研 
究 它 ,不 单纯 从 语义 类 ,而 是 从 语义 聚合 的 角度 来 观察 。 这 样 ,我们 
可 以 发 现 ,* 小 ?是 跟 *“ 大 ”对 立 的 ,最 多 再 跟 * 中 ”对 立 ,形成 "大 “中 ” 
“小 ”三 项 对 立 。“ 红 ”的 对 立项 就 有 “ 蓝 ”“ 白 ”"“ 黑 ?等 至 少 七 项 。 而 
“ 木 ”>“ 铁 ”等 表示 质料 的 对 立项 就 更 多 了 。 到 了 这 时 候 , 定 语 排列 的 
语序 规则 就 很 清楚 了 。 可 以 表示 如 下 : 


R，,: 对 立项 少 的 定语 之 对 立项 多 的 定语 


R。 比 Ri 抽象 ,同时 ,预测 能 力 增 强 了 。 并 且 R* 也 可 以 对 Ri 进行 解 
释 ,为 什么 表示 尺寸 的 定语 要 放 在 表示 颜色 的 定语 前 边 ? 因为 尺寸 
的 对 立项 少 ,只 有 大 、 中 、 小 三 种 ,而 颜色 的 对 立项 多 ,所 以 放 在 后 面 。 
R， 比 Ri 要 好 得 多 ,或 者 说 更 有 洞察 力 (insight) 。 

但 是 为 什么 要 这 样 排列 ? 一 条 规则 出 来 以 后 ,如 果 不 能 对 它 作 
出 解释 ,那么 它 就 是 不 完美 的 ,缺少 理论 的 魅力 。 所 以 我 们 要 作出 进 
一 步 的 解释 。 

我 们 从 信息 量 的 角度 来 解释 ,依据 下 面 的 信息 理论 : 一 个 信号 
所 传递 的 信息 量 的 大 小 ,并 不 依赖 于 这 个 信号 本 身 , 而 是 依赖 于 跟 这 
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个 信号 能 够 构成 替换 关系 的 信号 的 数目 。 如 果 能 够 替换 的 数目 很 
多 ,那么 这 个 信号 的 信息 量 就 很 大 ;如 果 能 替换 的 很 少 ,那么 这 个 信 
号 的 信息 量 就 很 小 。 我 们 容易 理解 这 个 。 比 如 英语 考试 的 时 候 , 不 
会 考 这 种 填空 题 : 


BE 下 这 


因为 ,这 里 x 处 只 能 填 t+。 请问, 这 个 + 有 多 少 信息 量 ? 显然 , 它 
几乎 不 传达 信息 ,因为 这 儿 只 能 填 t, 答 案 是 唯一 的 。 但 是 换 一 个 
词 : 


yea 元 


情况 就 大 为 不 同 了 。 因 为 ,这 里 z 处 可 以 填 入 1.m、p.r、d 等 ， 
从 而 造成 real ream \reap \rear \read 等 单词 。 于 是 ,这 里 面 每 个 二 的 
值 传递 的 信息 量 就 很 大 。 再 举 一 个 例子 ,假如 我 们 只 有 一 个 红 球 放 
在 口袋 里 ,不 用 猜 就 知道 这 是 个 红 球 ,没有 什么 信息 量 。 如 果 一 个 红 
的 一 个 白 的 在 口袋 里 转 几 圈 , 拿 出 一 个 来 猜 ,那么 信息 量 就 增 大 了 ， 
猜 中 的 可 能 性 就 减少 了 。 所 以 如 果 从 信息 量 的 角度 看 ,我 们 可 以 把 
Rs: 改写 成 Rs : 


Rs : 信息 量 小 的 定语 盖 信息 量 大 的 定语 


事实 上 ,R; 是 对 Rs 的 解释 。 如 果 把 语言 看 成 是 个 自足 的 系 
统 , 即 完全 独立 的 系统 ,那么 R。 就 到 底 了 ,这 是 语言 内 部 的 规则 , 跟 
外 部 不 发 生 交流 ,纯粹 是 一 种 独立 的 语言 信息 的 组 织 和 安排 方式 。 
但 语言 只 是 人 类 认 知 系统 中 的 一 个 子 系统 ,并 且 语言 是 通过 认 知 过 
程 来 产生 和 理解 的 ,这 中 间 有 一 个 认 知 加 工 的 问题 。 具 体 地 说 ,人 们 
说 话 时 ,经 过 大 脑 认 知 加 工 产生 语言 。 上 听 到 话语 时 ,用 大 脑 加 工 得 到 
它 的 语义 。 所 以 ,这 条 规则 是 应 当 从 认 知 的 角度 作出 解释 。 为 什么 
信息 量 小 的 定语 在 前 ;而 信息 量 大 的 定语 在 后 ? 必 

这 里 面 涉及 到 人 类 信息 加 工时 的 基本 策略 。 先 处 理 简 单 得 总 庆 
处 理 复杂 信息 。 举 个 例子 来 说 ,考试 的 时 候 ,发 下 试卷 来 ,者 前 面 的 
八 个 题目 是 容易 的 ,后 面 两 个 问题 是 难 的 ,每 题 20 分 ,前 面 八 个 天 是 
才 60 分 ,你 会 采取 什么 策略 ? 先 做 简单 的 ,后 做 后 面 40 分 的 难题 如 
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果 纯 粹 从 理性 的 角度 看 ,这 是 不 合理 的 , 刚 考试 的 时 候 , 头 脑 清醒 ,应 
该 先 做 难题 ,把 40 分 拿 下 来 ,然后 随便 做 几 道 ,60 分 就 到 手 了 。 但 是 
大 家 偏偏 不 这 样 做 ,我 们 往往 先 用 很 多 时 间 去 做 大 量 的 填空 题 呀 ,名 
词 解释 呀 ,最 后 才 做 难题 。 为 什么 ? 我 们 脑子 里 根深 蒂 固 的 策略 是 先 
处 理 容 易 的 信息 ,后 加 工 复杂 的 信息 。 已 经 形成 了 一 种 思维 定 势 。 

一 个 句子 可 以 从 语 用 上 分 成 话题 部 分 和 说 明 部 分 ,话题 传达 的 
一 般 是 旧 信 息 , 说 明 传达 的 一 般 是 新 信息 。 比 如 ,我 们 在 北京 坐 地 铁 
的 时 候 , 听 到 地 铁 上 用 英文 报 站 名 ， 


The next station is Xizhnizmaze7z。 XizPzz7ze7t is the next station。 
为 什么 不 倒 过 来 说 成 ， 
Xizpizaez js the next station。The next station is XizPz772e77。 


为 什么 ? 因为 在 坐车 的 语 境 中 ,The next station 是 个 变量 性 的 
成 分 ,没有 明确 、 绝 对 的 所 指 , 语 义 信 息 量 很 小 , 容易 加 工 ; 而 Xizj- 
mez 是 个 绝对 性 的 地 点 词语 ,传达 一 种 新 信息 。 已 经 有 了 前 一 句 中 
Xizhnizaez 这 个 确定 的 信息 以 后 ,再 说 Xizpizimaze7zt is the next station. 
就 很 自然 。 讲 故事 也 是 这 样 ,我 们 通常 把 新 信息 放 在 后 面 , 慢 慢 地 引 
导出 来 ,然后 再 放 在 另 一 个 故事 的 开头 。 比 如 ,上 一 回 评书 的 结语 是 
0 四 位 大 汉 正 在 酒楼 上 边 喝 边 聊 , 指 手 画 脚 地 议论 着 南 
源 北 腿 、 东 那 西 毒 , 谁 是 天 下 第 一 大 侠 。 蜂 ! 吃 ! 吃 ! 忽 听 得 楼 
梯 上 一 阵脚 步 声 , 众 好 汉 吓 得 一 个 个 脸色 如 土 。 要 问 来 者 是 谁 ? 
且 听 下 回 分 解 。 
害 得 听众 夜里 都 睡 不 好 觉 ,脑子 里 老 在 琢磨 : 来 的 是 哪 位 武林 高 人 ， 
竟然 让 四 位 英雄 都 大 惊 失色 。 第 二 天 ,一 听 下 一 回 的 开头 却 是 : 


前 文书 ,我 们 说 到 .…… 。 来 的 不 是 别人 ,原来 是 上 菜 的 伙 


这 也 是 为 了 适应 听众 信息 加 工 的 心理 需要 : 让 他 们 先 温习 已 经 知道 
的 故事 情节 , 先 加工 这 些 简 单 的 已 知 信息 ;然后 ,再 交代 他 们 最 关心 
的 新 的 故事 情节 , 解 开 上 次 留 下 来 的 悬念 ,加 工 这 些 相对 来 说 是 复杂 
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的 新 信息 。 
比如 ,上 文 说 的 定语 烦 序 问题 ,还 可 以 用 心理 学 和 计算 机 科学 上 
的 搜索 (Csearch) 理 论 ,来 作出 如 下 这 种 解释 ， 


中 “小 红 球 ” 的 搜索 结构 : 


9 
大 中 小 
红 黄 蓝 和 白 .……… 红 黄 蓝 和 白 …… 红 黄 蓝 ;- 柏 … 尝 ， 


@“ 红 小 球 ” 的 搜索 结构 : 


和 


大 申 必 少 * 厌 本 人 天 市 ”大 时 区 RN 全 


我 们 把 修饰 定语 的 中 心 词 看 成 是 一 个 问题 空间 , 找 某 一 种 颜色 、 
某 一 种 尺 才 的 球 , 这 是 一 个 目标 。 为 了 搜索 到 “小 红 球 ”这 个 目标 ,我 
们 把 它 分 成 几 个 组 ,组 下 又 分 层次 。 不 同 的 是 先 分 得 多 些 , 再 分 得 少 
些 ; 还 是 先 分 得 少 些 , 再 分 得 多 些 ? 这 两 种 表达 方式 构成 两 种 不 同 的 
搜索 路 径 , 同 时 也 构成 两 种 不 同 的 问题 求解 的 空间 结构 。 这 两 种 解 
决 问题 的 空间 结构 是 不 一 样 的 ,在 心理 学 和 人 工 智能 上 ,通常 把 四 叫 
做 深度 优先 策略 (depth first strategy), 把 加 叫做 广度 优先 策略 
Cbreadth first strategy) 。 从 概率 上 讲 , 两 者 是 等 价 的 ;从 搜索 的 效 
果 上 讲 ,@ 的 效果 更 好 些 。 因 为 如 果 它 碰巧 第 一 次 搜索 到 “ 红 ”, 接 下 
来 最 多 搜索 三 次 就 能 找到 目标 。 第 一 种 方式 即使 第 一 次 搜索 到 
“小 ”, 接 下 来 的 可 能 性 还 是 不 大 。 但 是 人 们 还 是 喜欢 用 @ 这 种 形式 ， 
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先 找 “ 小 ”, 再 找 “ 红 ”。 也 就 是 说 ,人 们 在 信息 加 工时 ,乐于 用 深度 优 
先 的 策略 ,而 不 用 广度 优先 的 策略 ,为 什么 ? 因为 尽管 @ 的 效率 是 高 
的 ,但 是 人 们 想 万 一 第 一 次 碰 不 上 ,搜索 “ 红 ” 可 能 会 需要 很 多 次 数 ， 
比如 有 七 种 颜色 的 话 , 就 有 可 能 要 搜索 七 次 。 接 下 来 即使 一 下 子 碰 
到 “小 ”, 也 已 经 用 了 八 次 。 而 @ 的 话 , 即 使 第 一 次 碰 不 上 ,即使 在 最 
不 走运 的 情况 下 ,至 多 第 三 次 就 能 搜索 到 “小 ”, 接 下 来 只 要 在 五 次 内 
找到 “ 红 ”, 也 不 比 @ 慢 。 所 以 人 们 愿意 用 @ 〇 ,比较 稳妥 。 我 们 再 考虑 
这 样 一 个 问题 : 

这 里 有 一 段 100 米 长 的 下 水 道 堵 了 。A 是 起 点 ,也 是 终点 。 怎 
么 来 找到 堵 的 地 方 X 呢 ? 有 两 种 方法 。 一 种 是 平分 法 : 在 50 米 处 


人 如 也 


如 果 不 流水 ,那么 X 在 AC 段 ; 如 果 流 水 ,那么 和 在 CB 段 。 如 
此 继续 进行 下 去 ,一 定 能 找到 X。 其 实 另 一 种 分 割 办 法 更 好 , 即 黄金 
分 割 法 。 在 AB 的 0.618 处 , 即 约 2/3 处 打 一 个 孔 ,或 C 或 D， 
人 
如 果 C 处 无 水 , 则 在 AC 段 , 就 只 有 1/3 的 长 度 了 ;如 果 C 处 有 
水 , 则 在 CB 段 ,如 此 继续 下 去 ,就 能 找到 X, 效 率 比 平分 法 高 。 但 
是 ,人 们 一 般 都 愿意 用 平分 法 , 它 不 费 脑筋 ,一 次 次 下 去 ,一 定 能 找到 
X。 三 分 法 要 考虑 的 方面 多 ,比如 ,在 C 处 还 是 D 处 打 孔 呢 ? 还 得 琢 
磨 一 番 ,去 计算 也 麻烦 ,大 脑 不 愿意 去 做 这 种 选择 工作 ,这 是 人 类 信 
息 加 工 的 一 个 基本 策略 。 因 此 ,全 知 全 能 的 哲学 家 要 抱怨 说 : 人 是 
一 种 具有 有 限 理 性 的 动物 。 
我 们 可 以 把 Rs 推广 ,把 “信息 量 小 的 定语 ? 改 成 “信息 量 小 的 成 
分 ”, 就 得 到 下 面 的 规则 : 
R4 : 信息 量 小 的 成 分 > 信息 量 大 的 成 分 


并 且 还 可 以 继续 追究 : 为 什么 是 这 种 顺序 呢 ? 因为 信息 量 小 的 成 分 
容易 加 工 。 于 是 ,得 到 王 面 这 条 更 抽象 的 规则 : 


Rs : 容易 加 工 的 成 分 > 不 易 加 工 的 成 分 
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这 一 套 规则 基本 上 是 语言 中 的 普遍 规则 。 因 为 人 类 的 认 知 结构 
相似 ,人 类 的 认 知 过 程 . 认 知 策略 也 差不多 。 

当然 ,语言 里 面 语序 的 排列 除了 遵循 这 套 规则 以 外 ,还 有 其 他 一 
些 规则 。 有 些 现象 是 不 能 用 这 套 规 则 来 解释 的 ,因为 不 同 的 规则 之 
间 要 相互 打架 竞争。 比如 有 一 个 句子 不 符合 信息 量规 则 : 

白色 长 统 袜子 

长 统 . 中 统 、 低 统 , 最 多 三 个 对 立 ,白色 却 有 很 多 对 立 。 按 照 信息 
量 原则 ,应 当 说 成 “长 统 白 色 袜 子 ", 可 是 这 不 行 , 不 合 语法 ,非得 
说 成 白色 长 统 袜子 不可。 为 什么 ? 原来 ,颜色 词 修 饰 名 词 是 受 
限制 的 “白色 袜子 ”不 能 说 ,要 说 “白色 的 袜子 ”.。“ 白 色 ( 的 ) 长 统 
袜子 "中 的 “的 ”实际 省 略 了 。 为 什么 能 省 略 ? 名 词 的 定语 比较 
多 , 层 层 修饰 的 时 候 “ 的 ?可 以 省 略 ;单独 一 个 定语 ,的 ”不 能 省 
略 。 这 样 ,语言 内 部 规则 要 求 “ 白 色 ” 跑 到 “长 统 ” 的 前 面 去 , 且 可 
以 省 略 “ 的 ”。 

我 举 了 这 人 么 一 些 例子 ,来 说 明 我 们 可 以 从 认 知 科学 ,尤其 是 
信息 加 工 心理 学 这 个 角度 来 研究 语言 ;同时 ,还 从 计算 机 科学 和 
技术 的 角度 来 研究 语言 。 这 样 的 语言 研究 的 成 果 可 以 反 过 来 对 
计算 机 科学 .心理 学 和 其 他 科学 都 有 实用 的 价值 ,甚至 对 于 对 外 
汉语 教学 也 是 比较 管用 的 。 以 上 举 的 例子 都 是 比较 简单 的 ,更 
进一步 的 问题 由 于 时 间 关 系 就 不 再 介绍 了 。 有 些 可 以 参看 《 国 
外 语言 学 ?1996 年 第 2 期 上 我 写 的 一 篇 介绍 认 知 语言 学 的 文 
章 。 

好 ,今天 我 就 讲 这 些 问题 ,谢谢 大 家 ! 


1996 年 10 月 在 北京 大 学 中 文系 “ 子 民 学 术 论 坛 ? 上 的 演讲 
徐 刚 记录 整理 

(收入 费 振 刚 、 温 儒 敏 主编 《北大 中 文 研 究 》， 
北京 大 学 出 版 社 ,1998 年 ) 

2004 年 9 月 改写 
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论 元 角色 的 层级 关系 和 语义 特征 


本 文 主要 讨论 汉语 动词 的 各 种 论 元 角色 的 层级 关系 ,详细 地 刻画 各 
种 论 元 角色 的 动态 性 的 语义 特征 。 首 先 ,介绍 国 外 语言 学 界 对 于 论 元 、 论 
旨 角 色 、 论 元 位 置 、 论 元 结构 、 论 旨 阶 层 等 概念 的 定义 和 认识 。 然 后 ,讨论 
汉语 动词 的 论 元 结构 研究 的 五 个 方面 的 内 容 ( 论 元 数目 、 论 旨 角 色 、 名 法 
特征 .语义 特征 、 配 位 方式 ) 及 其 基本 的 研究 原则 和 处 理 技术 。 接 着 ,讨论 
不 同 的 论 元 角色 之 间 的 关系 ,建立 一 个 汉语 动词 的 论 元 角色 的 层级 体系 ; 
着 重 描写 各 别论 元 角色 在 述 谓 结构 中 所 表现 出 来 的 动态 性 的 语义 特征 ， 
也 兼 及 它们 各 自 的 句法 特征 。 最 后 ,通过 实例 讨论 不 同 的 论 元 角色 在 句 
法 上 的 共 现 关系 和 语义 上 的 转化 关系 。 


1 3 引 人 


IJ 


对 现代 汉语 动词 的 论 元 结构 进行 研究 ,一 方面 可 以 发 现 施 事 ` 受 
事 等 语义 成 分 跟 主 语 、 宾 语 等 句法 成 分 之 间 的 投射 关系 ,加 深 我 们 对 
汉语 的 结构 面 魏 的 全 面 认 识 ; 另 一 方面 可 以 为 计算 机 处 理 汉语 提供 
比较 充分 的 语义 知识 方面 的 资源 ,满足 机 器 翻译 、 信 息 抽取 、 快 速 检 
索 等 涉及 语义 信息 的 处 理 技术 的 需求 。 当 然 , 汉 语 动词 的 论 元 结构 
方面 的 知识 ,可 以 帮助 第 二 语言 学 习 者 更 好 地 理解 汉语 的 句子 结构 
和 语义 解释 之 间 的 映射 关系 ,对 于 对 外 汉语 教学 也 有 直接 的 应 用 价 
值 。 有 鉴于 此 ,我 们 开展 了 现代 汉语 动词 的 论 元 结构 的 研究 项 目 。 
在 此 ,我 们 首先 把 在 研究 过 程 中 碰 到 的 一 些 原则 性 的 问题 摆 出 来 ,说 
明 自 己 的 观点 和 处 理 办 法 ,然后 着 重 讨论 汉语 动词 的 各 种 论 元 角色 
的 层级 关系 ,详细 地 刻画 各 种 论 元 角色 的 动态 性 的 语义 特征 `. 也 兼 及 
其 句法 特点 ,通过 实例 讨论 不 同 的 论 元 角色 在 句法 上 的 共 现 关系 及 
其 论 旨 角色 转换 的 语义 机 制 。 以 期 起 到 抛砖引玉 的 作用 ,希望 得 到 
广大 同行 的 指正 。 
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2 ”关于 论 元 结构 的 几 个 基本 概念 及 其 含义 


要 研究 汉语 动词 的 论 元 结构 ,首先 必须 引进 几 个 理论 概念 ,并 严 
格 厘定 其 含义 和 使 用 范围 。 为 了 便于 跟 国外 的 相关 研究 进行 比较 ， 
我 们 首先 根据 顾 阳 (1994) ,介绍 下 列 术 语 及 其 定义 : 


(1) 论 元 (argument) : 指 带 有 论 旨 角色 的 名 词 短语 。 

(2) 论 旨 角色 (thematic role): 由 谓词 根据 与 其 相关 的 名 
词 短语 之 间 语 义 关 系 而 指派 (assign) 给 这 些 名 词 短 语 的 语义 角 
色 。 谓 词 有 其 固有 的 论 间 角 色 , 这 些 角色 表示 谓词 所 涉及 的 主 
体 、 客 体 或 动作 行为 状态 .所 处 的 场所 动作 的 起 点 \ 方 向 、 终 
点 、 原因 及 引起 的 结果 、 凭 借 的 工具 ,等 等 。 目 前 公认 的 论 旨 角 
色 有 施 事 者 (agent), 感受 者 (experiencer), 受 惠 者 (benefac- 
tive) ,客体 (theme) ,使 役 者 (cause/causer), 等 等 ,并 通常 将 受 
影响 的 客体 称 作 受 事 者 (patient) 。 


论 旨 和 角色 这 一 概念 的 产生 及 运用 反映 出 语言 学 家 试图 透 过 表层 
的 语法 关系 ,如 主语 宾语 同 述 语 的 结构 关系 ,更 深入 地 了 解 述 语 与 
论 元 成 分 之 间 的 语义 关系 ,以 及 这 种 语义 关系 对 语法 的 影响 。 


(3) 论 元 位 置 : 论 元 在 句 中 所 占 的 位 置 。 

(4) 论 元 结构 (atgurneiit structure): 一 个 词 项 的 论 元 结构 
就 是 该 词 项 所 能 拥有 的 一 组 已 经 标 有 论 旨 角色 名 称 的 论 元 二 这 
是 把 论 元 结构 看 作 是 论 骨 角色 关系 的 同义词 , 论 元 结构 中 所 含 
的 内 容 无 非 就 是 一 系列 的 论 旨 角色 z 

(5) 论 旨 阶层 (thematic hierarchy):， 指 论 旨 角色 在 词汇 概 
念 结构 中 的 排列 形式 ,由 于 大 家 相信 论 旨 角 色 是 按照 阶层 的 形 
式 排 列 的 ,因而 称 为 论 旨 阶层 。 例 如 : 

施 事 > 处 所 /终点 /起 点 盖 客体 

论 旨 角色 在 论 旨 阶层 中 的 位 置 跟 其 在 句子 中 的 位 置 ( 即 论 元 位 


置 ) 直 接 相 关 , 比 如 : 施 事 通常 占据 主语 的 地 位 ,处 所 等 通常 占据 状 
语 的 地 位 , 受 事 通常 占据 宾语 的 地 位 。 
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从 上 面 的 术语 解释 和 说 明 ,我 们 大 致 可 以 看 出 国外 论 元 结构 研 
究 的 主要 内 容 和 目的 。 


3 动词 论 元 结构 研究 的 主要 内 容 和 相关 原则 


汉语 动词 的 论 元 结构 的 研究 应 该 吸收 国内 外 配 价 语法 、 格 语 
法 、 生 成 语法 、 论 元 结构 理论 研究 的 有 关 成 果 , 特 别 是 最 近 二 十 多 
年 来 汉语 动词 的 配 价 研究 的 成 果 , 根 据 计 算 机 处 理 汉语 等 实际 应 
用 的 需要 来 确定 汉语 动词 的 论 元 结 梅 的 研究 内 容 。 其 主要 内 容 应 
该 包括 :9 
(1) 论 元 属性 : 确定 每 一 个 动词 能 支配 多 少 个 必用 论 元 、 
多 少 个 可 用 论 元 ; 
(2) 论 旨 属性 : 标定 这 些 论 元 在 语义 上 的 功能 ,， 即 论 旨 和 角 
色 ; 
(3) 语法 特征 : 描写 这 些 论 元 在 句法 上 的 功能 和 所 受到 的 
多 法 约束 ; 
(4) 语义 特征 : 描写 这 些 论 元 的 动态 的 语义 特征 和 静态 的 
语义 特征 ; 
(5) 配 位 方式 : 描写 动词 及 其 论 元 的 多 法 配置 方式 


“ 论 元 属性 "argument property) 指 的 是 动词 所 能 关联 的 论 元 的 
数目 ,这 方面 的 内 容 可 以 参考 配 价 语法 的 研究 成 果 ;“ 论 旨 属 性 ” 
(thematic property) 指 的 是 各 个 论 元 的 论 骨 角色 ,这 方面 的 内 容 可 
以 参考 格 语法 的 研究 成 果 ; 语 法 特征 ”(grammatical feature) 包 括 句 
法 功能 (symntactic function) 和 范畴 特征 (categorical feature) 两 个 方 
面 ,前 者 指 各 个 论 元 在 句子 中 各 自 可 以 充当 什么 样 的 句法 成 分 ( 比 
如 : 主语 、 宾 语 、 状 语 ), 后 者 指 各 个 论 元 通常 由 什么 样 的 词类 范畴 来 
实现 (比如 : 施 事 、 受 事 通常 由 名 词性 成 分 来 实现 , 致 事 通常 由 名 词 
或 动词 性 成 分 来 实现 ,场所 、 源 点 、 终 点 通常 由 处 所 性 成 分 来 实现 )， 


四 参考 汤 廷 池 、 张 淑敏 1996) ,第 261 页 。 
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这 方面 的 内 容 可 以 参考 论 元 结构 的 研究 成 果 ; 语 义 特 征 ”(semantic 
feature) 包 括 动态 的 语义 特征 和 静态 的 语义 特征 两 个 方面 ,前 者 指 的 
是 各 个 论 元 在 述 谓 结构 中 表现 出 来 的 施 动 性 、. 受 动 性 等 语义 特点 ,后 
者 指 实现 不 同 的 论 旨 角 色 的 词语 在 语义 上 受到 的 约束 (比如 : 施 事 、 
与 事 通常 由 指 人 名 词 来 实现 , 受 事 则 既 可 以 由 指 人 名 词 来 实现 ,也 可 
以 由 指 物 名 词 来 实现 ), 对 于 这 方面 的 内 容 , 可 以 参考 词汇 语义 学 和 
论 元 结构 理论 等 的 研究 成 果 .“ 配 位 方式 ”Cargument selection ) 指 
的 是 依存 于 同一 个 动词 的 各 个 论 元 在 句子 中 的 共 现 和 选择 限制 , 即 
怎样 构成 一 个 或 几 个 相关 的 句 式 , 这 方面 的 内 容 可 以 参考 配 价 语法 
和 论 元 结构 理论 的 研究 成 果 。 必 须 注 意 的 是 ,所 谓 动词 的 论 元 结构 
实际 上 指 的 是 动词 的 某 个 义 项 或 义 位 (sememe) 的 论 元 结构 ;也 就 是 
说 ,同一 个 动词 的 不 同 义 位 可 能 具有 各 不 相同 的 论 元 结构 。 
在 研究 这 五 项 内 容 之 前 ,必须 首先 明确 下 列 问题 : 


(1) 怎样 确定 每 个 具体 的 动词 所 能 支配 的 论 元 的 数目 , 怎 
样 区 分 必用 论 元 和 可 用 论 元 ,在 什么 样 的 框架 中 确定 动词 所 能 
支配 的 论 元 的 数目 ,用 介词 引导 的 从 属 成 分 算 不 算数 ,怎样 分 清 
动词 的 论 元 结构 和 动词 性 结构 的 论 元 结构 的 区 别 ? 

(2) 怎样 标定 这 些 论 元 的 语义 角色 ,怎样 处 理论 旨 角 色 的 
模糊 性 问题 ,到 底 设 立 多 少 个 论 旨 角色 ,怎样 区 分 不 同 的 论 旨 角 
色 ，, 要 不 要 引进 论 旨 角色 的 层级 系统 ,怎样 处 理 某 些 动 词 在 特定 
句 式 中 增加 进来 的 论 元 ? 

(3) 怎样 描写 论 元 和 谓词 的 句法 配置 方式 ,分 不 分 基础 句 
式 和 派生 句 式 ,标志 性 的 虚词 要 不 要 包括 进来 ? 

(4) 怎样 描写 不 同 论 元 的 语义 特征 ,分 不 分 动态 特征 和 静 
态 特 征 ,不 同 论 元 的 句法 特征 怎样 抽取 ,怎样 跟 词 义 的 层级 体系 
和 有 关 的 句 式 描写 挂 起 钩 来 ? 


最 后 ,但 并 非 最 不 重要 的 问题 是 研究 结果 的 表述 问题 ,这 至 少 包 括 下 
列 两 个 问题 : 

(1) 采用 什么 样 的 描写 体例 和 表示 方式 ? 

(2) 怎样 处 理 说 明文 字 、 缩 写 符号 、 数 字 代码 、 通 用 规则 、 个 


论 元 角色 的 层级 关系 和 语义 特征 141 


例 说 明 、 具 体例 证 之 间 的 排列 关系 ? 


关于 动词 的 论 元 数目 ,我 们 的 体会 是 : 为 了 比较 全 面 地 反映 动 
词 对 其 从 属 成 分 的 支配 能 力 , 为 了 最 大 程度 上 从 动词 的 论 元 结构 去 
把 握 有 关 和 句 式 的 结构 和 意义 ,应 该 既 包 括 必 有 论 元 Cobligatory argu- 
ment)、\ 也 包括 可 有 论 元 (Coptional argument) 。 但 是 ,限于 那些 从 动 
词 的 词汇 意义 上 可 以 推导 出 来 ,并 且 是 在 一 定 的 句法 结构 中 实现 了 
的 从 属 成 分 ,形成 一 套 相 对 可 操作 的 .由 动词 所 激活 的 意义 场景 跟 
“动词 十 论 元 ? 式 的 句法 配 列 (syntactic arrangement) 相 互 验证 的 核 
查 程序 。 这 样 ,那些 几乎 可 以 跟 所 有 的 动词 共 现 (co-occurence) 的 时 
间 .处 所 等 成 分 就 应 该 排除 在 动词 的 论 元 结构 之 外 。 

关于 论 元 的 论 旨 角色 (简称 论 元 角色 ) ,我 们 承认 它 源 自 人 们 对 
由 动词 所 激活 的 语义 场景 (semantic scene) 的 认识 ,尤其 是 同一 场景 
中 相关 的 参与 者 (participants) 之 间 的 相对 关系 的 认识 。 因 此 , 论 元 
角色 难免 有 一 定 的 模糊 性 .不 容易 用 一 种 形式 化 的 办 法 来 严格 地 定 
义 。 但 是 ,我 们 可 以 采用 原型 理论 ,首先 给 出 不 同 的 论 元 角色 的 典型 
的 句法 .语义 特征 ,然后 通过 类 比 归 类 的 办 法 来 确定 特征 不 明显 的 语 
义 成 分 的 论 元 角色 。 

必须 指出 的 是 ,动词 的 各 种 论 元 角色 可 以 根据 其 名 法、 语义 特 点 
而 聚合 成 不 同 层级 的 类 ,从 而 形成 一 个 论 元 角色 的 层级 体系 (hierar- 
chy) 。 根 据 我 们 的 经 验 , 现 代 汉 语 动词 的 论 元 角色 可 以 组 织 进 如 下 
这 个 层级 体系 之 中 : 


论 元 
at 
一 般 论 元 超级 论 元 
核心 论 元 外 围 论 元 
主体 论 元 客体 论 元 凭借 论 元 环境 论 元 
4 AS 系 2 方 AS 范 命 
事 事 事 事 事 事 果 象 事 具 料 式 所 点 点 围 题 


142 基于 认 知 的 汉语 计算 语言 学 研究 


其 中 ,超级 论 元 (super argument 指 由 谓词 性 成 分 充当 的 论 元 ， 
这 种 论 元 本 身 就 是 某 种 论 元 结构 的 实现 形式 。 核 心 论 元 (kernel ar- 
gument) 指 动词 的 必 有 论 元 ,它们 对 构成 基本 的 述 谓 结构 (基础 命 
题 ) 来 说 是 不 可 缺少 的 ;其 中 ,主体 论 元 以 作 主 语 为 其 主要 的 句法 实 
现形 式 ,客体 论 元 以 作 宾 语 为 其 主要 的 句法 实现 形式 。 外 围 论 元 
Ccircumstantial argument) 指 动词 的 可 有 论 元 ,它们 起 到 扩充 基本 的 
述 谓 结构 ,形成 复杂 命题 的 作用 ;它们 以 作 状 语 为 其 主要 的 句法 实现 
形式 ,其 中 凭借 论 元 跟 环 境 论 元 的 区 分 主要 出 于 语义 上 的 考虑 。 

关于 论 元 角色 的 语义 特征 ,应 该 分 为 动态 特征 和 静态 特征 两 个 
方面 。 论 元 角色 的 动态 特征 , 指 不 同类 型 的 论 元 角色 在 述 谓 结构 中 
所 具有 的 语义 特征 , 即 在 由 动词 所 表示 的 事件 结构 中 所 表现 出 来 的 
特征 。 比 如 , 施 事 具 有 施 动 性 、 受 事 具 有 受 动 性 ` 结 果 具 有 渐 成 性 .与 
事 具 有 自主 性 工具 具有 移动 性 材料 具有 变化 性 .处 所 具有 不 变性 ， 
等 等 。 显 然 , 这 种 特征 不 依赖 于 充当 某 种 论 元 角色 的 名 词性 成 分 本 
身 的 词汇 语义 特征 。 论 元 角色 的 静态 特征 , 指 充当 某 种 论 元 角色 的 
名 词性 成 分 本 身 的 语义 特征 ; 换 句 话说 ,具有 某 种 语义 特征 的 名 词性 
成 分 比较 适合 于 作 某 种 论 元 角色 。 比 如 , 作 施 事 的 名 词性 成 分 一 般 
具有 [十 有 生 (animate)] 和 [十 人 类 (Chuman)] 的 语义 特征 、 作 工具 的 
名 词性 成 分 具有 [十 器 具 (tool)] 的 语义 特征 、 作 材料 的 名 词性 成 分 
具有 [十 材料 Cmaterial)] 的 语义 特征 。 显 然 , 这 种 特征 取决 于 充当 某 
种 论 元 角色 的 名 词性 成 分 本 身 的 词汇 语义 特征 ,但 是 不 依赖 于 语句 
的 述 谓 结构 。 一 般 地 说 ,研究 论 元 角色 的 动态 特征 有 助 于 反映 动词 
的 论 元 结构 跟 句子 的 语义 解释 之 间 的 投射 关系 , 据 此 可 以 直接 从 动 
词 的 论 元 结构 上 预测 相关 句子 的 语义 构造 ;研究 论 元 角色 的 静态 特 
征 有 助 于 说 明 动 词 跟 其 从 属 名 词 之 间 的 语义 选择 关系 , 据 此 可 以 直 
接 说 明 句子 中 不 同 成 分 之 间 在 语义 上 的 同 现 限 制 。 

论 元 之 间 的 句法 配置 (syntactic arrangement) 方 式 简 称 配 位 方 
式 Cargument selection), 它 反映 的 是 施 事 、 受 事 等 论 元 角色 跟 主 语 、 
宾语 等 句法 成 分 和 动词 之 前 动词 之 后 等 句法 位 置 之 间 的 映射 关系 。 
比如 : A 十 V 十 P/R( 小 王 切 了 一 根 黄瓜 /一 盘 黄瓜 片 儿 ),L 十 V 着 十 
Th( 桌 子 上 放 着 一 部 《4 康 四 字 典 》 ,等 等 。 显 然 , 描 述 了 论 元 角色 的 
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句法 配置 ,就 等 于 是 建立 了 一 种 标注 了 语义 关系 的 句法 格式 ,这 种 名 
法 格式 当然 是 一 种 最 接近 语义 表达 式 的 句法 表达 式 , 便 于 建立 句法 
结构 形式 跟 语 义 结构 关系 之 间 的 映射 和 连接 。 配 位 方式 的 研究 ,应 
该 做 到 以 下 四 点 : 


〈1) 要 充分 反映 不 同 的 论 元 角色 之 间 的 同 现 限 制 及 其 在 表 
层 结 构 中 的 语序 位 置 ; 

《2) 要 充分 反映 不 同 的 论 元 角色 可 能 出 现 的 句法 位 置 及 其 
出 现 条 件 ; 

《3) 要 充分 反映 不 同 的 论 元 角色 的 形态 特征 ,比如 在 什么 
位 置 上 出 现时 必须 带 什么 样 的 格 标记 (case marker); 比 如 : A 
十 把 P 十 VP( 小 李 把 书 扔 了 ),A 十 向 Go 十 VP (老人 向 小 巷 深 
处 走 去 ); 

《4) 要 充分 利用 动词 的 各 种 形态 标记 ,比如 : 工 十 V 着 十 Th 
(桌子 上 放 着 一 部 《 康 始 字典 》)-~>x 工 十 A 十 V 着 十 Th(Cx 桌子 
上 我 放 着 一 部 4 康 始 字 典 )~ 工 十 V 了 十 Th( 桌 子 上 放 了 一 部 
《 康 始 字典 访 一 L 十 A 十 V 了 十 Th( 桌 子 上 我 放 了 一 部 ( 康 四 字 
典 。 


4 各 别论 元 角色 的 定义 和 名 法 .语义 特点 


这 一 部 分 尝试 对 现代 汉语 动词 常见 的 17 种 论 元 角色 , 先 给 出 其 
宽泛 的 语义 定义 并 辅 以 一 定 的 例证 ,再 描述 其 动态 的 语义 特征 、 给 出 
其 比较 突出 的 句法 特征 ,最 后 列表 比较 。 

1. 施 事 (agent, 简称 A) 

施 事 : 自主 性 动作 行为 的 发 出 者 。 例 如 : 

小 王 吃 了 一 个 盆 头 弟弟 正 看 电视 呢 
妹妹 笑 了 他 们 踢 了 一 会 儿 足 球 
这 些 例 子 中 的 主语 是 施 事 (agent) ,它们 共有 的 、 动 态 的 语义 特点 是 : 


《1) 自立 性 (independent), 即 其 所 指 的 事物 先 于 动词 所 表示 的 事件 
独立 存在 ;(2) 使 动 性 Ccausationy, 即 其 所 指 的 事物 施行 某 个 动作 、 
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或 造成 某 种 事件 或 状态 。 其 中 ,及 物 动词 的 施 事 跟 受 事 或 结果 相对 
待 , 因 而 是 施 事 的 典型 成 员 。 
2. 感 事 (sentient ,简称 Se) 
感 事 : 非 自主 的 感知 性 事件 的 主体 。 例 如 : 
老 王 认识 李 校 长 哥哥 喜欢 武打 上 
刘 老 师 太 累 了 这 孩子 又 困 了 
这 些 例 子 中 的 主语 是 感 事 , 它 们 共有 的 语义 特点 是 : (1) 自立 性 ， 
(2) 感知 性 (sentience and/or perception), 即 其 所 指 的 事物 在 由 动 
词 所 表示 的 事件 中 表现 出 了 某 种 感知 能 力 。 支 配 感 事 的 动词 一 定 是 
感觉 -心理 动词 (mental/psychical verbs) ,其 中 及 物 动词 的 感 事 比较 
接近 于 施 事 ,形容 词 的 感 事 比 较 接 近 于 主事 。 并 且 , 及 物 动 词 的 感 事 
是 跟 对 象 相对 待 的 。 
3. 致 事 (causer, 简 称 Cau) 
致 事 : 某 种 致使 性 事件 的 引起 因素 。 例 如 


老师 的 硅 奖 使 孩子 们 很 兴 硒 父亲 严峻 的 脸色 叫 我 们 十 分 害 怕 


和 


他 的 成 就 令 同行 美 莫 这 种 局 势 让 大 家 性 丐 不 安 


这 些 例子 中 的 主语 是 致 事 (Ccauser) ,它们 共有 的 、 动 态 的 语义 特点 
是 : (1) 自立 性 ,(2) 使 动 性 , 即 其 所 指 的 事物 引发 了 某 种 感知 性 事 
件 ;(3) 述 谓 性 (predicative), 即 它 直 接 和 间接 地 指 陈 (denote) 一 个 
致使 性 的 (causative) 事 件 , 正 是 这 个 致使 性 事件 作为 原因 造成 了 作 
为 结果 的 某 种 感知 性 事件 ; 比如， 老师 的 夸奖 ”直接 指 陈 老师 夸奖 孩 
子 们 这 件 事 ,父亲 严峻 的 脸色 ”间接 指 陈 父亲 摆 出 了 严峻 的 脸色 .9 
4. 主事 (theme, 简 称 Th) 
主事 : 性 质 、 状 态 或 变化 性 事件 的 主体 。 例 如 : 
小 亚 奖 予 去 全 阁 孙 锅 里 的 水 开 了 
小 允 拉 沟 里 了 符 后 的 析 遇 了 
这 些 例子 中 的 主语 是 主事 ,它们 共有 的 语义 特点 是 : (1) 自立 性 ， 


@ 关于 “使 ”字句 主语 的 语义 特点 , 详 见 圳 入 林 (2002) 。 
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《2) 变化 性 (change of state), 即 其 所 指 的 事物 的 状态 在 由 动词 所 表 
示 的 事件 中 发 生 了 变化 。 并 且 , 及 物 动 词 的 主事 是 跟 系 事 相对 待 的 。 

一 般 地 说 ,支配 施 事 的 动词 是 动作 动词 和 自主 动词 ,支配 主事 的 
动词 是 非 动作 动词 和 非 自 主动 词 。 支 配 感 事 的 是 心理 动词 和 表示 感 
党 的 形容 词 , 可 以 合 称 为 感知 动词 (包括 形容 词 ); 在 自主 性 上 ,它们 
介 于 自主 和 非 自 主 之 间 。 支 配 致 事 的 是 “使 . 叫 ( 教 )、 令 .让 ”等 数量 
极 少 的 致使 动词 ,它们 都 是 非 自主 动词 。 在 意义 上 ,整个 施 事 . 感 事 、 
致 事主 事 可 以 看 作 是 原型 施 事 (proto-typical agent) 的 四 个 典型 性 
渐 减 的 小 类 。 可 以 列表 对 照 如 下 : 


论 元 \ 语 义 特点 


为 了 方便 和 周全 ,我们 把 主事 当 作 是 主体 论 元 的 收容 所 一 一 凡是 不 
便 归 和 人 施 事 、 致 事 和 感 事 的 主体 论 元 都 放 进 主事 。 这 样 , 虽 然 像 
“是 ~“ 有 ”一 类 动词 的 主语 不 一 定 有 变化 性 的 特点 ,但 是 我 们 可 以 从 
容 地 把 它们 纳入 主事 。 

从 句法 上 看 ,主体 论 元 共有 的 特点 是 能 作 基础 句 的 主语 ,但 是 ， 
其 相应 的 谓语 动词 在 形式 和 意义 上 都 有 一 定 的 差别 : 施 事 的 谓语 是 
自主 动词 ,能 受 “ 不 ?和 “没有 ”修饰 ,如 “不 吃 ”~…“ 没 有 吃 ”“ 不 走 ”~ 
“没有 走 ”; 感 事 的 谓语 是 感知 动词 ,能 受 “ 不 ”修饰 .但 一 般 不 受 “ 没 
有 ”修饰 ,如 "不 认识 ~“=* 没有 认识 ”"“ 不 困 ”~…“x 没有 困 ”; 致 事 的 
谓语 是 非 自主 动词 ,一 般 不 受 “ 不 ”和 “没有 ”的 修饰 ,如 <“* 不 /? 没有 
使 孩子 们 高 兴 ?”“* 不 /* 没 有 叫 我 们 害怕 >”“x 不 /? 没有 令 同 行 羡 
莫 "“* 不 /? 没有 让 大 家 性 丽 不 安 ”; 主事 的 谓语 是 非 自主 动词 ,能 
受 ` 没有 "修饰 .一 般 不 受 “ 不 ”修饰 ,如 “没有 掉 ?~“x 不 掉 ?“ 没 有 
醒 " 一 ? 不 醒 ”。 可 以 列表 对 比如 下 : 
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论 元 \ 句法 特 油 作 基础 句 的 主语 | 出 现在 “不 VP? 之 前 | 出 现在 “没有 VP" 之 前 


从 分 布 上 看 , 施 事 . 感 事 、. 致 事 、 主 事 是 不 能 同 现 的 , 即 没 有 对 立 的 价 
值 ;因此 ,也 可 以 把 这 四 个 论 元 角色 合成 一 个 不 加 区 分 ,统称 为 主体 。 
退 一 步 说 ,即使 区 分 不 清 这 四 个 论 元 角色 也 不 影响 论 元 角色 系统 的 
大 局 。 

5s. 受 事 (patient ,简称 了 ) 

受 事 : 因 施 事 的 行为 而 受到 影响 的 事物 。 例 如 : 


老 际 吃 了 一 个 划 果 弟弟 打 了 一 个 蕉 
韩 老师 批评 了 小 刚 老兵 常常 欺负 新 兵 - 

这 些 例 子 中 的 宾语 是 受 事 , 其 语义 特点 是 : (1) 自立 性 ,(2) 变化 性 ， 
(3) 受 动 性 (causally affected) , 即 其 所 指 事物 承受 由 动词 所 表示 的 
动作 行为 的 影响 。 受 事 一 定 是 跟 施 事 相 对 的 ,它们 共同 成 为 某 种 类 
型 的 及 物 动 词 的 两 个 改 有 论 元 Cobligatory arguments) 。 

6. 与 事 (dative, 简称 D) 

与 事 : 动作 ,行为 的 非 主 动 的 参与 者 。 例 如 : 


张 三 给 了 李 四 一 本 词典 老板 对 座 员 发 火 
小 孙 问 了 老师 一 个 问题 你 向 当事人 打听 一 下 


在 这 些 例 子 中 ,动词 的 近 宾 语 或 介词 的 宾语 是 与 事 , 其 语义 特点 是 : 
(1)》 自立 性 ,(2) 受 动 性 ,参与 性 (participant), 即 其 所 指 事物 自愿 或 
被 迫 参 与 到 由 动词 所 表示 的 动作 、 行 为 或 事件 中 去 。 与 事 一 定 是 跟 
施 事 相对 的 ,对 于 双 宾 动 词 来 说 ,与 事 还 跟 受 事 相 对 。 施 事 、 受 事 和 
与 事 共 同 成 为 双 宾 动 词 的 三 个 必 有 论 元 。 
7. 结果 (result, 简 称 及 ) 
结果 : 由 施 事 的 动作 行为 造成 的 结果 。 例 如 : 
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妈妈 给 我 织 了 一 件 毛衣 ”孩子 在 来 子 上 中 了 一 个 肚 印 
爸爸 挖 了 一 个 菜 窜 他 把 窗户 纸 捅 了 一 个 富 窗 
这 些 例 子 中 的 宾语 是 结果 ,其 语义 特点 是 : (1) 变化 性 ,(2) 受 动 性 ， 
《3) 渐 成 性 (incremental) , 即 其 所 指 事物 是 在 由 动词 所 表示 的 事件 
中 逐步 形成 的 ,这 一 点 正好 跟 自立 性 相反 。 结 果 一 定 是 跟 施 事 相 对 
的 ,它们 共同 成 为 某 种 类 型 的 及 物 动词 的 两 个 必 有 论 元 。 
8. 对 象 (target, 简称 Ta) 
对 象 : 感知 行为 的 对 象 和 目标 (target) 。 例 如 
和 爸 苞 认识 刘 校 长 小 王 玖 悉 广告 业务 
妹妹 喜欢 区 鞭 性 李 小 明 相信 通 灵 术 


这 些 例子 申 的 宾语 是 对 象 , 其 语义 特点 是 (1) 自立 性 ,(2) 关 涉 性 
《concerned), 即 其 所 指 表示 相应 感 事 所 感知 的 对 象 和 目 标 等 关联 
物 。 对 象 一 般 是 跟 感 事 相对 的 ,它们 共同 成 为 某 种 类 型 的 及 物 动词 
(主要 是 心理 动词 ) 的 两 个 上 必 有 论 元 。 
9. 系 事 (relevant ,简称 Re) 
系 事 : 在 事件 里 跟 主事 相对 的 事物 。 例 如 


老 赵 是 售 库 保管 册 。。。 许 先生 有 三 个 儿 了 
这 些 房子 属于 地 质 学 院 。 小 平地 第 二 和 
我 们 叫 她 知心 姐姐 郝 海 东 踢 中 锋 


这 些 例子 中 的 宾语 或 远 宾 语 是 系 事 ,其 语义 特点 是 ; (1) 自立 性 ， 
〈2) 类 属性 (classification/attribute) ， 即 其 所 指 表 示 相 应 主事 的 属 
性 .类 型 等 。 

在 意义 上 ,整个 受 事 、 结 果 .与 事 . 对 象 和 系 事 可 以 看 作 是 原型 受 
事 (prototypical patient) 五 个 典型 性 渐 减 的 小 类 。 可 以 列表 对 比如 
下 : 
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为 了 方便 和 周全 ,我 们 把 系 事 当 作 是 客体 论 元 的 收容 所 一 一 凡是 不 
便 归 人 和 人 受 事 、 与 事 、 结 果 和 对 象 的 客体 论 元 都 放 进 系 事 。 这 样 ， 像 
“是 >"“ 有 ”“ 属 于 ”一 类 动词 的 宾语 ,虽然 它们 没有 变化 性 的 特点 ,但 
是 我 们 可 以 从 容 地 把 它们 纳入 系 事 。 

从 句法 上 看 ,客体 论 元 共有 的 句法 功能 是 能 作 基 础 句 的 宾语 。 
其 中 , 受 事 和 与 事 可 以 作 双 宾 动 词 的 宾语 ( 即 分 别 作 远 宾语 和 近 宾 
语 ) ,而 结果 、 对 象 和 系 事 不 能 ; 受 事 和 结果 可 以 作 介词 “把 ”的 宾语 ， 
与 事 、. 对 象 和 系 事 不 能 。 可 以 列表 对 比如 下 : 


论 元 \ 句 法 特点 [本 和 的 大 党 作 近 宾语 | 作 远 宾 语 | 作 “ 把 ”的 宾语 
受 事 | 十 十 
与 事 | 站 到 
结果 | 十 二 
对 象 | 生 妆 
系 事 十 


从 分 布 上 看 , 受 事 .与 事 、 结 果 和 对 象 在 某 些 句 式 中 是 可 以 同 现 
的 , 即 具 有 对 立 的 价值 ;因此 ,必须 把 这 四 个 论 元 角色 加 以 区 分 。 然 
后 ,把 论 旨 角色 不 太 明 显 的 客体 论 元 归 和 人 系 事 。 

10. 工具 (instrument ,简称 J) 

工具 : 动作 、 行 为 所 凭借 的 器 具 。 例 如 : 

苑 苑 用 显微镜 看 切片 ~ 和 葡 符 正 看 显微镜 喝 

这 些 例子 中 的 宾语 或 介词 宾语 是 工具 ,其 语义 特点 是 : (1) 自立 性 ， 
(2) 位 移 性 (movement), 即 其 所 指 事物 在 由 动词 所 表示 的 事件 中 可 
以 移动 位 置 。 
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11. 材料 (material , 简称 Ma) 
材料 : 动作 ,行为 所 用 的 材料 。 例 如 
姐姐 用 毛线 织 了 一 件 土 衣 一 姐姐 正 织 毛 线 呢 
和 区 和 苑 用 米 滑 水 浇 花 一 和 苑 和 苑 正 滋 米 江 水 呢 
这 些 例子 中 的 宾语 或 介词 宾语 是 材料 ,其 语义 特点 是 : (1) 自立 性 ， 
《2) 位 移 性 ,(3) 变化 性 , 即 其 所 指 的 事物 在 动作 、 行 为 中 消耗 掉 了 
或 者 由 原料 变 为 成 品 。 
12. 方式 (manner, 简 称 MD) 
方式 : 动作 行为 所 采取 的 方式 方法 。 例 如: 
他 用 低音 喝 了 一 首 《 船 夫 曲 》~ 余子 真一 向 喝 低音 
这 些 纸 包 得 捆 双 十 字 这 些 软 糖 你 还 是 包 小 包 吧 
这 些 例 子 中 的 宾语 或 介词 宾语 是 方式 ,其 语义 特点 是 : 非 自 立 性 和 
附庸 性 (existence not independent of event) ， 即 其 所 指 状况 依 附 于 
由 动词 所 表示 的 动作 .行为 之 上 。 
工具 、` 材 料 和 方式 这 三 个 凭借 论 元 跟 动词 所 表示 的 动作 行为 关 
系 密 切 ,一 般 直 接 融入 由 动词 所 表示 的 事件 中 。 这 跟 以 处 所 为 原型 
的 环境 论 元 不 同 ,环境 论 元 一 般 为 动词 所 表示 的 事件 设 定 外 部 的 空 
间 条 件 。 也 就 是 说 ,在 跟 动词 的 语义 关系 方面 ,环境 论 元 可 能 比 凭借 
论 元 更 为 外 围 。 和 凭借 论 元 和 环境 论 元 作为 外 围 论 元 ,它们 共有 的 语 
义 特 征 是 : 既 不 具有 使 动 性 ,也 不 具有 受 动 性 。 这 是 它们 区 别 于 核 
心 论 元 的 地 方 , 可 以 列表 对 比如 下 ， 


从 句法 上 看 ,工具 、\ 材 料 ,方式 .处 所 等 论 元 角色 一 般 都 能 在 基础 
句 中 作 介 词 的 宾语 。 其 中 ,工具 可 以 作 “ 用 ”的 宾语 ,还 能 通过 话题 化 
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而 作 主 语 。 材 料 可 以 作 “ 用 ”和 “把 ”的 宾语 ,还 能 通过 话题 化 而 作 主 
语 。 方 式 可 以 作 “ 用 ”的 宾语 ,一 般 不 能 话题 化 。 处 所 可 以 作 "在 ”的 
宾语 ,还 能 通过 话题 化 而 作 主 语 。 可 以 列表 对 比如 下 : 


论 元 \ 句 法 特点 


上 面 我 们 用 处 所 作为 代表 ,来 说 明 环 境 论 元 跟 凭借 论 元 在 句法 、 
语义 上 的 差别 。 下 面 , 我 们 把 环境 论 元 分 为 场所 、 源 点 和 终点 三 种 论 
旨 角 色 ,来 具体 地 讨论 一 下 。 
13. 场所 (location ,简称 工 ) 
场所 : 动作 、\ 行 为 发 生 的 处 所 。 例 如 : 
小 王 在 里 园 跑 一 小 王 跑 里 较 老 刘 在 食堂 吃饭 一 老 刘 吃 食堂 
老 候 在 江湖 上 冶 荡 了 几 十 年 ~ 老 候 间 荡 江 湖 几 十 年 

14. 源 点 (souree, 简称 So) 

源 点 : 动作 、 行 为 开始 的 地 点 或 时 间 。 例 如 


一 个 犯人 从 监狱 里 跑 也 一 从) 监狱 里 跑 也 一 从 犯人 
一 决 石头 从 山顶 上 滚 下 来 一 (从 ) 山 顶 上 滚 下 来 一 一 块 石头 
长 江 发 源 于 青藏 高 原 这 种 制度 起 源 于 唐 朝 
他 们 昨天 离开 北京 去 上 海 “40 年 代 她 脱离 了 党 组 织 
15. 终点 (goal ,简称 Go) 
终点 : 动作 、 行 为 结束 的 地 点 .时 间或 状态 。 例 如 : 


他 往 桌 上 放 了 一 本 书 一 桌 上 放 了 一 本 书 


嫌疑 犯 跑 国外 了 
我 们 村 来 了 三 个 知青 搞 阴 谋 的 人 必定 以 失败 而 告终 
孩子 去 姥姥 家 了 火车 正 志 到 达 北 京 站 


场所 、 源 点 和 终点 三 种 论 元 角色 主要 跟 处 所 相关 ,可 以 总 称 为 处 
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所 论 元 。 这 三 种 论 元 角色 的 区 别 是 : 源 点 可 以 用 在 “自从 ”一 类 介 
词 之 后 \ 不 能 用 在 “在 、 到 、 向 、 往 ”一 类 介词 之 后 ,可 以 通过 话题 化 而 
作 主 语 或 通过 述 题 化 而 作 宾 语 ;终点 可 以 用 在 “在 、 到 、 向 、 往 ”一 类 介 
词 之 后 \ 不 能 用 在 “ 自 \ 从 ”一 类 介词 之 后 ,可 以 通过 话题 化 而 作 主 语 
或 通过 述 题 化 而 作 宾 语 ;场所 则 不 论 起 点 和 终点 ,可 以 用 在 “在 ”二 
类 介词 之 后 ,不 能 用 在 “ 自 、 从 ?或 “到 向 、 往 ”一 类 介词 之 后 ,不 能 通 
过 话题 化 而 作 主 语 但 可 以 通过 述 题 化 而 作 宾 语 。 它 们 在 句法 上 的 差 
别 可 以 列表 对 比如 下 : 


16. 范围 (range, 简 称 Ral) 
范围 : 动作 \ 行 为 所 涉及 的 数量 、 频 率 、 幅 度 . 时 间 等 相关 事项 。 
例如 : 
一 个 西瓜 买 三 决 钱 一 个 小 时 殉 二 十 公里 
会 议 持 续 了 三 个 小 时 双方 僵持 了 半年 
他 们 休息 星期 天 老 王 值 星期 六 ,我 值 星期 天 
为 了 方便 和 周全 ,我们 把 范围 当 作 是 外 围 论 元 的 收容 所 一 一 凡是 不 
便 归 入 凭借 论 元 和 处 所 论 元 的 其 他 外 围 论 元 都 可 以 放 进 范围 。 
17. 命题 (proposition , 简称 Pn) 
命题 : 由 主 谓 结 构 、 述 宾 结 构 或 动词 ,形容词 等 谓词 性 成 分 充当 
的 论 元 , 它 本 身 具 有 一 个 由 谓词 及 其 论 元 构成 的 论 元 结构 ;在 外 部 的 
语义 功能 上 , 它 以 整体 充当 主体 论 元 或 客体 论 元 。 例 如 : 


大 家 认为 这 事 不 赖 小 王 小 刘 跳 槽 影响 了 达 利 公 司 的 声誉 


导语 
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5 不 同 的 论 元 角色 之 间 的 配合 关系 


不 同 的 论 元 角色 之 间 有 着 严格 的 同 现 限 制 关 系 , 表 现 为 : 有 的 
论 元 角色 可 以 共 现 \ 有 的 论 元 角色 不 能 共 现 有 的 论 元 角色 出 现时 强 
制 性 地 要 求 某 种 论 元 角色 共 现 。 下 面 ,我 们 通过 例子 来 说 明 哪 些 论 
元 角色 可 以 跟 哪些 论 元 角色 共 现 。 
(1) 施 事 可 以 单独 出 现 , 或 者 跟 受 事 ,与 事 ` 结 果 等 相配 对 ,可 以 
表示 为 : 


(3 


Yo 


〈4) 


S1:- 人 十 -3 
S2:-: 人 十 一 十 了 
S3 : 在 十 R 


例如 : 老 王 走 了 。 
例如 : 答 和 爸 买 了 一 本 书 。 
例如 : 哥哥 做 了 一 张 椅 子 。 


S4: A 十 十 D 十 P; 例如 : 宋 老 师 给 了 我 两 本 词典 。 
(2) 感 事 可 以 单独 出 现 , 或 者 跟 对 象 等 相配 对 ,可 以 表示 为 : 


S5 2 Se 十 
S6s Se 二 十 Tax 


例如 : 苑 务 困 了 。 
例如 : 老 陈 认识 许 主 任 。 


主事 可 以 单独 出 现 , 或 者 跟 系 事 等 相配 对 ,可 以 表示 为 : 


S7 : 了 贡 二 3 
S8 : Th 十 十 Re; 


例如 : 炉膛 里 的 火 灭 了 。 
例如 : 叶 文 龙 是 一 条 好 汉 。 


工具 、 材 料 方式 等 一 般 跟 施 事 及 其 配对 成 分 受 事 和 结果 共 
现 , 可 以 表示 为 : 


s9ji 戈 证 藤 和 评 “让 ; 
S10， 
有 从 
S12 : 


S13 : 
S14: 
S15 : 
S16 : 
SL17 : 


A 十 用 I 十 “十 Ri 


A 十 用 M 十 “十 P; 
A 十 用 M 十 十 R; 例如 


办 示人 六 厅 配 例如 : 
A 十 “十 Mai 例如 : 
A 十 “十 MI; 例如 


例如 
例如 : 
A 十 用 Ma 十 _ 十 P; 例如 ; 
A 十 用 Ma 十 “十 R; 例如 : 


例如 : 


妈妈 用 小 刃 切 西瓜 。 

管 爸 用 铁 欠 挖 了 一 个 菜 窖 。 
奶奶 用 米 滑 水 浇 兰 花 。 
姐姐 用 细毛 线 织 了 一 件 上 
匀 . 

老 张 用 双 十 字 捆 被 子 。 


: 孙 晓 平 用 高 音 喝 了 一 首 歌 。 


我 切 这 把 大 刀 。 
妈妈 正在 织 毛 线 呢 。 
3 我 捆 双 十 字 。 
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《5) 致 事 一 般 跟 感 事 配 对 出 现 , 可 以 表示 为 ， 
S18: Cau 十 十 Se 十 VP;， 例如 : 区区 的 身体 使 全 家 人 担心 。 


6 结语 : 论 元 角色 变化 的 语义 机 制 


显然 ,上 文 讨论 的 17 种 论 元 角色 肯定 不 能 涵盖 现代 汉语 动词 的 
论 元 的 所 有 的 论 旨 角色 。 为 了 有 效 地 说 明 句 子 的 结构 形式 跟 意 义 结 
构 之 间 的 关系 ,分 化 和 说 明 歧 义 句 式 ,上 文 所 列 的 论 元 角色 在 必要 时 
须 作 更 为 精细 的 分 别 。 比 如 , 施 事 有 时 须 分 为 施 益 性 的 和 受益 性 的 ， 
与 事 有 时 须 分 为 目标 性 (或 受益 性 ) 的 和 来 源 性 (或 施 益 人 性) 的 , 受 事 
有 时 须 分 为 对 象 性 的 和 范围 性 的 ,结果 有 时 须 分 为 同 源 性 的 后 果 性 
的 和 成 品 性 的 ,工具 有 时 须 分 为 人 体 性 的 、 器 具 性 的 和 材料 性 的 。 例 
如 : . 


全 二 小 王 正 (给 他 孩子 ) 理 发 呢 
b. 小 王 正 ( 在 理发 店 ) 理 发 呢 
c.， 小 王 正 在 理发 呢 
《2) a.， 刘 为 借 给 老 张 一 辆 自行 车 
b. 刘 为 向 老 张 借 一 辆 自行 车 
c,， 刘 为 借 老 张 一 辆 自行 车 
《3 翅 张 老 三 正 浇 草 坪 呢 
b. 张 老 三 正 浇 菜 苗 呢 
c,， 张 老 三 正 浇 菜 园 呢 
(4) a 这 孩子 又 摔 了 一 个 跟 寺 
b.， 这 孩子 又 掉 了 一 个 大 包 
c. 这 孩子 又 画 了 一 幅 年 画 
(5 av 他 用 双手 贴 标 语 
b.， 他 用 刷子 贴 标 语 
c， 他 用 灼 糊 贴 标 语 
《la) 中 的 “小 王 ? 是 施 益 性 的 施 事 ,(1b) 中 的 “小 王 ? 是 受益 性 的 施 事 ， 
《lc) 中 的 “小 王 ?是 两 可 的 。(2a) 中 的 “ 老 张 * 是 目标 性 (或 受益 性 ) 的 
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与 事 ,(2b) 中 的 “ 老 张 > 是 来 源 性 (或 施 益 性 ?的 与 事 ,(2c) 中 的 “ 老 张 ” 
是 两 可 的 ;(3a) 中 的 “草坪 ?是 范围 性 的 受 事 ,(3b) 中 的 “ 菜 苗 ?是 对 象 
性 的 受 事 ,(3c) 中 的 “菜园 ?似乎 是 两 可 的 。 

有 时 ,两 种 论 元 角色 会 合并 为 一 种 论 元 角色 结果 可 能 产生 一 种 
新 的 论 元 角色 。 例 如 : 


《6) a. 老 王 用 锤子 把 屋顶 砸 了 一 一 个 油 
b. 质 石 把 屋顶 硬 了 一 个 洞 


(6b) 的 “陨石 > 是 动力 (force), 相 当 于 (5a) 中 施 事 “ 老 王 ” 和 工具 锤 
子 " 的 合并 。 

有 时 ,不同 的 论 元 角色 之 间 还 会 发 生动 态 语义 的 转变 ,从 而 从 一 
种 论 元 角色 转变 为 另 一 种 论 元 角色 。 例 如 : 


(7) a. 他 们 正 用 水 和 泵 抽 着 污水 呢 
b. ? 他 们 正 抽 着 污水 呢 
c. 水 和 又 正 抽 着 污水 呢 
(8) a. 我 们 常常 在 食堂 吃 中 饭 
b. 中 饭 我 们 常常 吃食 堂 
(9) a。 他 用 小 棍 儿 掏 乌 窝 
b. 他 用 小 棍 儿 掏 鸟 蛋 
c。 他 用 小 棍 儿 从 久富 里 掏 鸟 蛋 
(10) a. 答 和 爸 拍 了 一 下 我 的 让 膀 
b. 爸爸 在 我 的 肩膀 上 拍 了 一 下 


原来 (7a) 中 的 工具 “水 泵 ?在 (7c) 中 施 事 化 了 ,原来 (8a) 中 的 场所 “ 食 
堂 在 (8b) 中 受 事 化 了 ,原来 (9a、10a) 中 的 范围 性 受 事 “ 鸟 窝 ”? 和 “我 
的 肩膀 ”分别 在 (9c、10b) 中 处 所 化 了 。 可 见 , 论 元 成 分 的 施 事 化 和 受 
事 化 是 以 占据 主语 或 宾语 位 置 为 语法 形式 标志 的 , 论 元 成 分 的 处 所 
化 是 以 后 加 方位 词 和 占据 状语 位 置 为 语法 形式 标志 的 。 

我 们 相信 ,引入 论 元 角色 的 细 分 、 合 并 和 转化 等 语义 机 制 , 是 


@， 详 见 豆 久 林 (1998) ,第 122 一 142 页 。 
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简化 描述 论 元 成 分 的 论 旨 角 色 的 有 效 手 段 ;否则 ,设立 再 多 的 论 旨 角 
色 也 是 难以 穷尽 所 有 的 论 元 成 分 的 各 种 微妙 复杂 的 语义 作用 的 。 
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一 套 汉 语 动词 的 论 元 角色 
的 语法 指标 


本 文 考察 了 现代 汉语 动词 常见 的 17 种 论 元 角色 的 语法 表现 ,并 以 这 
些 论 元 角色 的 下 列 分 布 特征 和 转换 特征 作为 测试 条 件 : (i) 能 否 直接 作 主 
语 或 宾语 等 句法 成 分 , (ii) 能 否 作 “ 把 /被 ”字句 的 主语 ,(iii) 能 否 作 介词 
“把 /被 /由 ?的 宾语 ,(iv) 能 否 作 "用 /在 /到 /从 / 往 /向 ”等 介词 的 宾语 ,(v) 
能 否 作 “"VV/V 一 V/V 了 V?" 等 动词 重合 形式 的 主语 或 宾语 ,(vi) 能 否 作 
“不 /没有 VP? 等 否定 形式 的 主语 或 宾语 ,(vii) 能 否 作 “V- 成 ?一 类 复合 动 
词 的 宾语 ,(viii) 能 否 通过 左 向 或 右 向 出 位 而 成 为 话题 或 述 题 等 ,从 语法 
形式 上 界定 不 同 的 论 元 角色 应 该 具备 的 一 套 语 法 指标 ,希望 为 定义 不 同 
的 论 元 角色 提供 可 把 握 的 操作 程序 。 


1 引 


节 


动词 的 论 旨 角 色 (thematic role) 是 根据 不 同 的 论 元 (argument) 
跟 动 词 的 语义 关系 而 划分 出 来 的 ,或 者 说 是 根据 论 元 在 由 动词 及 
其 论 元 构成 的 述 谓 结构 (predication) 中 的 语义 作用 而 确立 的 。 比 
如 ,如 果 一 个 名 词性 成 分 在 述 谓 结构 中 具有 施 动 性 , 那 余 这 个 论 元 
的 论 旨 角色 (简称 “ 论 元 角色 ”) 就 是 施 事 ; 如 果 二 个 名 词性 成 分 在 
述 谓 结 构 中 具有 受 动 性 ,那么 这 个 论 元 的 论 则 角色 就 是 受 事 。 显 
然 , 论 元 角色 是 根据 论 元 成 分 在 述 谓 结构 中 动态 的 语义 特征 而 划 
分 出 来 的 。 由 于 这 种 语义 特征 具有 较 大 的 模糊 性 ,因而 在 具体 的 
处 理 上 难免 见仁见智 ;表现 为 : (1) 不 同 的 学 者 所 设立 的 论 元 角色 
的 数目 可 能 相当 悬 殊 ,(2) 对 不 同 的 论 元 角色 的 定义 相差 极 大 、 并 
且 彼 此 之 间 可 能 难以 对 应 和 折合 。 这 种 局 面 导 致 在 论 元 角色 的 系 
统 上 缺少 可 比 性 ,使 从 事 汉 语 信 息 处 理 和 汉语 教学 等 实际 应 用 工 
作 的 人 士 无 所 适 从 。 

有 鉴于 此 ,我 们 考察 了 现代 汉语 中 动词 常见 的 17 种 论 元 角色 的 
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语法 表现 Cgrammatical behaviour) , 着重 以 下 列 句 法 分 布 特点 或 句 
法 转换 特点 为 测试 条 件 : 

(iD)- 能 否 直接 作 主 语 或 宾语 等 句法 成 分 ， 

(ii) 能 否 作 “把 /被 ?字句 的 主语 ， 

(iii) 能 否 作 介词 “把 /被 /由 ?的 宾语 ， 

(iv) 能 否 作 “用 /在 /到 /从 / 往 / 向 ?等 介词 的 宾语 ， 

(v) 能 否 作 *VV/V 一 V/V 了 V? 等 动词 重 登 形式 的 主语 

或 宾语 ， 

(vi) 能 香 作 “不 /没有 VP?” 等 否定 形式 的 主语 或 宾语 ， 

CviiD) 能 和 否 作 “V- 成 ”一 类 复合 动词 (或 动词 结构 ) 的 宾语 ， 

Cviii) 能 香 通 过 左 向 或 右 向 出 位 而 成 为 话题 或 述 题 , 等 等 。 
以 此 作为 从 语法 形式 上 界定 不 同 的 论 元 角色 的 一 套 语法 指标 


(Cgrammatical guidelines) 。 
2 各 种 论 元 角色 的 语法 指标 


下 面 依次 描述 17 种 论 元 角色 的 主要 的 语法 表现 ,希望 它们 能 够 
成 为 界定 不 同 的 论 元 角色 的 一 整套 具有 一 定 的 可 操作 性 的 语法 指 
标 . 
L. 施 事 
(1) 作 基 础 句 的 主语 ,例如 : 
弟弟 灵 了 | 小 张 吃 了 一 碗 汤面 
(2) 作 *“ 把 ”字句 的 主语 ,例如 ， 
少 张 把 那 碗 米饭 吃 了 | 哥哥 把 校长 给 得 罪 了 
(3) 作 “ 被 、 由 ”等 介词 的 宾语 ,例如 ; 
那 碗 米饭 被 小 张 吃 也 | 后 勤 工 作 由 老 刘 负责 
(4) 作 “V( 一 )V、 VC 了 )V” 等 重 套 形式 的 主语 ,例如 : 
你 试 (一 ) 试 | 妈妈 笑 ( 了 ) 笑 | 李 二 妨 搬 了 报 嘴 


@ 本 文 在 描述 论 元 角色 的 语法 表现 时 ,主要 以 朱德 黑 (1982) 为 参照 系统 。 
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《5) 作 ”* 不 VP” 和 “没有 VP” 等 否定 形式 的 主语 ,例如 : 
小 沈 不 去 一 小 沈 没 有 去 
刘 伟 不 考研 究 生 一 刘 伟 没 有 考研 究 生 
《6) 一 般 不 在 宾语 位 置 上 出 现 , 除 非 句 首 是 处 所 性 成 分 ,例如 
小 明 笑 了 一 * 笑 了 小 明 | 客人 来 了 盖 家 里 来 客人 大 了 
《7) 作 主 语 时 可 以 左 向 出 位 (leftrdislocation) 而 成 为 话题 ,原来 
的 位 置 上 可 以 是 句法 空位 (syntactic gap)， 留 下 的 空位 也 可 
由 续 指 代词 (resumptive pronoun)“ 他 ”等 来 填充 ,例如 ， 
我 妹妹 ,她 ] 笑 个 不 停 | 小 刚 ,[ 他 ] 考 上 了 清华 大 学 
2. 感 事 
(1) 作 基 础 句 的 主语 ,例如 : 
弟弟 累 了 | 小 张 认 识 王 大 夫 | 哥 哥 非 常 喜欢 西洋 画 
《2) 不 作 ”* 把 字句 的 主语 ,例如 : 
* 小 张 把 王 大 夫 认 识 了 |#* 哥 哥 把 西洋 画 非 常 喜欢 
《3) 不 作 ”* 被 .由 ”等 介词 的 宾语 ,例如 : 
尖 王 大 夫 被 小 ` 张 认识 了 | 关 西洋 画 由 哥哥 喜欢 
(4) 不 作 “V( 一 )V、 V( 了 )V” 等 重奏 形式 的 主语 ,例如 
x 你 累 ( 一 ) 累 | x 妈妈 困 ( 了 ) 轩 
#* 李 二 妨 认 识 了 认识 玉 老 师 
作 “ 不 VP” 这 种 否定 形式 的 主语 ,不 作 * 没 有 VP” 这 种 否定 
形式 的 主语 ,例如 : 
小 沈 不 累 一 关 小 沈 没 有 累 
刘 伟 不 认识 厂 长 一 *< 刘 伟 没有 认识 厂 长 
(6) 不 在 宾语 位 置 上 出 现 , 即 由 它 造 成 的 主 谓 结构 不 能 直接 转 
换 为 述 宾 结 构 , 例 如 : 
小 明寺 本 人 累 了 小 明 | 客人 困 了 一 * 困 了 客人 
作 主 语 时 可 以 左 向 出 位 而 成 为 话题 ， 原来 的 位 置 上 可 以 泥 
句法 空位 , 留 下 的 空位 可 由 续 指 代词 “他 ”等 来 填充 ,例如 
我 妹妹 ,[ 地 ] 累 得 直 不 起 腰 | 
小 刚 民 他 ] 认 识 我 们 学 校 的 陈 会 计 


《5 


\- 


人 


YL 
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3. 致 事 
(1) 作 基 础 句 的 主语 ,例如 : 


(2) 不 作 “ 把 字句 的 主语 ,例如 ， 
x 弟弟 的 话 把 我 很 难 直 
x 小 张 的 处 境 把 大 家 担心 坏 了 


(3) 不 作 “ 被 、 由 ”等 介词 的 宾语 ,例如 ， 
x 我 被 弟弟 的 话 很 难堪 
关 大 家 被 小 张 的 处 境 担心 坏 了 


(4) 不 作 “V( 一 )V\ VC 了 )V? 等 重 释 形式 的 主语 ,例如 : 
x 弟弟 的 话 使 (一 ) 使 我 很 难堪 
关 小 张 的 处 境 巴 (一 ) 串 大 家 担心 


(5) 一 般 不 作 “ 不 VP” 和 “没有 VP” 等 否定 形式 的 主语 ,例如 
x 弟弟 的 话 不 使 我 很 难 坟 
? 小 张 的 处 境 没有 叫 大 家 担心 


(6) 不 能 在 宾语 位 置 上 出 现 , 即 由 它 造 成 的 主 谓 结构 不 能 直接 
转换 为 述 宾 结 构 , 例 如 : 


(7) 作 主 语 时 可 以 左 向 出 位 而 成 为 话题 ,原来 的 位 置 上 只 能 是 
句法 空位 , 即 留 下 的 空位 上 不 能 用 续 指 代词 “他 、 这 ”等 来 填 
充 , 例 如 : 


一 套 汉 语 动 词 的 论 元 角色 的 语法 指标 161 


弟弟 的 话 ,Cx 这 ] 使 我 很 难堪 
小 张 的 处 境 ,[x 那 ] 叫 大 家 担心 


二 奖 0 
是 二 刘 站 从 人 了 视 


《1) 作 基 础 句 的 主语 ,例如 : 
弟弟 长 了 一 过 本 夺 |、 张 掉 了 一 个 钱包 
河 里 的 冰 都 化 了 | 墙 也 韦 了 
(2) 一 般 不作 “ 把 ”字句 的 主语 ,例如 : 
? 小 张 把 钱包 丢 了 |?? 哥哥 把 手表 掉 了 
类 弟弟 把 疗 长 在 手指 上 
《3) 一 般 不 作 “ 被 \ 由 ?等 介词 的 宾语 ,例如 # 
? 我 的 书 被 小 张 寺 了 | * 那 块 手表 由 哥哥 掉 河 里 了 
〈4) 不 作 “V( 一 )V、` VC 了)V” 等 重 又 形式 的 主语 ,例如 ; 
* 你 丢 ( 一 ) 丢 钱包 | * 妈妈 掉 ( 了 ) 掉 手表 
< 弟弟 长 了 长 病 子 
(5) 不 作 * 不 VP” 这 种 否定 形式 的 主语 ,可 作 “ 没 有 'VP” 这 种 否 
定形 式 的 主语 ,例如 : 
x 小 沈 不 丢 钱 包 一 小 沈 没 有 丢 钱 包 
* 刘 伟 不 掉 东 西 一 刘 伟 没 有 掉 东 西 
(6) -- 般 不 在 宾 消 位 置 上 出 现 ， 除非 句 首 是 处 所 性 成 分 ,例如 : 
河 里 的 冰 都 化 了 一 “化 了 河 里 的 冰 一 ? 河 里 化 了 不 少 冰 
东 面 的 墙 都 坦 了 ~ x 组 了 东 面 的 墙 ~ 一 特 己 彬 上 坦 了 一 一 面 寺 
(7) 作 主 语 时 一 一 般 不 能 左 向 出 位 而 成 为 话题 ， 例如 
? 我 妹妹 ,[ 她 ] 又 丢 了 一 个 钱包 
x 小 刚 ,[ 他 ] 昨 天 掉 了 一 个 钱包 
S. 受 事 
〈1) 作 基 础 句 的 宾语 , 作 双 宾语 句 中 的 远 宾 语 (直接 宾语 ), 例 
如 : 
弟弟 吃 了 一 本 个 苹果 | 李 院 院 长 批评 了 王 大 夫 
翅 妈 给 弟弟 一 一 个 皮球 | 老 张 抽 了 我 一 包 万 宝 路 
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(2) 作 * 把 ”等 介词 的 宾语 ,不 作 “ 为 对 ` 给 、 向 、 蔡 ?等 介词 的 宾 
语 , 例 如 : 
弟弟 把 那个 苹果 吃 了 | 李 院 长 把 王 大 夫 批评 了 一 顿 
妈妈 把 皮球 给 了 弟弟 | * 李 院 长 为 王 大 夫 批 评 了 一 顿 
x< 第 弟 对 那个 革 果 吃 了 | * 李 院 长 给 王 大 夫 批 评 了 一 顿 
x 妈妈 向 皮球 给 了 弟弟 | * 李 院 长 蔡 王 大 夫 批 评 了 一 顿 
(3) 作 “ 被 "字句 的 主语 ;例如 ， 
苹果 被 弟弟 吃 了 | 王 大 夫 被 李 院 长 批评 了 一 上 顿 
那个 皮球 被 妈妈 给 了 和 邻居 家 的 孩子 
(4) 作 “V( 一 )V\VC 了 )V” 等 重 乔 形式 的 宾语 ,例如 : 
点 (一 ) 点 人 数 | 汇报 (了 ) 汇 报 情况 | 俊 ( 一 ) 俊 王 老 师 
(5) 作 ”“ 不 VP” 和 “没有 VP" 等 否定 形式 的 宾语 ,例如 : 
不 了 解 情况 一 一 没有 了 解 情况 | 不 吃 米饭 一 没有 吃 米 饭 
(6) 不 作 基 础 句 的 主语 ; 即 由 它 造 成 的 述 宾 结 构 不 能 转换 为 相 
应 的 主 谓 结构 ,例如 : 
了 解 案情 一 * 案情 了 解 | 接待 客人 一 * 客人 接待 
吃 锰 头 一 * 锰 头 吃 
(7) 作 动词 的 宾语 时 可 以 左 向 出 位 而 成 为 话题 ,原来 的 位 置 上 
可 以 是 空位 , 留 下 的 空位 也 可 由 续 指 代词 “他 ”等 形式 填充 ; 
作 介 词 “把 ”的 宾语 时 可 以 左 向 出 位 而 成 为 话题 ,原来 的 位 
置 上 不 可 以 是 空位 ,这 个 空位 必须 用 续 指 代词 “他 ”等 形式 
填充 。 例 如 : 
大 闪 蟹 ,我 吃 过 [这 种 东西 了 | 小明 ,我 见 过 [他 ] 
那 支 毛 笔 我 已 经 把 它 扔 了 | 我 的 词典 ,你 把 它 搁 哪儿 了 
(8) 不 作 “V- 成 一 一 类 复合 动词 的 宾语 ;例如 ， 
< 吃 成 锰 头 | * 批评 成 小 李 


@ 在 “ 李 院 长 给 王 大夫 批 评 了 一 顿 > 中 , 当 “ 王 大 夫 ” 是 施 事 时 ,这 个 句子 是 合格 的 ; 
这 时 ,介词 “给 用 在 受 事主 语句 里 引导 施 事 ,其 作用 跟 * 叫 让、 被 "相似 ;并 且 , 施 事 可 以 省 
略 , 说 成 :“ 李 院 长 给 批评 了 一 顿 >。 参 考 朱德 申 (1982) ,第 179 一 180 页 。 
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6. 与 事 
〈1) 一 般 不 作 基础 名 的 宾语 ,可 作 双 宾语 句 中 的 近 宾 语 (间接 宾 
语 ), 例 如 : 
弟弟 借 孙 老师 一 本 词典 | 老 张 问 我 一 个 问题 
[25 不 作 “ 把 ”等 介词 的 宾语 , 作 “ 为 、 对 、 给 、 向 、 蔡 ” 等 介词 的 宾 
语 , 例 如 : 
人 
医生 给 病人 把 脉 | 弟弟 向 目击 者 打听 过 这 事 
我 蔡 你 把 关 | * 老 张 把 我 问 一 个 问题 
(3) 不 作 ” 被 ”字句 的 主语 ,例如 ， 
* 孙 老 师 被 弟弟 借 了 一 本 词典 |* 病人 被 王 大 夫 把 脉 
关 邻居 家 的 孩子 被 我 妈妈 给 了 一 个 皮球 
(4) 一 般 不 作 “V( 一 )V、V( 了 )V2” 等 重 丢 形式 的 宾语 7 例如 ， 
? 问 ( 一 ) 问 厂 长 房子 的 事 | 关 送 G 了 ) 送 王 老 师 一 束 花 
(5) 可 作 “ 不 VP” 和 “没有 VP” 等 否定 形式 的 宾语 ,例如 ， 
不 问 老 刻 僵 没有 问 老 刘 | 不 送 他 们 大 米 一 没有 送 他 们 大 米 
《6) 不 作 基 础 句 的 主语 , 即 由 它 造成 的 述 宾 结 构 不 能 转换 为 相 
应 的 主 谓 结 构 , 例 如 : 
问 小 刘 ( 一 件 事 ) 一 关 小 刘 问 (一 件 事 ) 
送 他 (一 本 书 ) 僵 # 他 送 (一 本 书 ) 
《7) 作 动 词 的 宾语 时 可 以 左 向 出 位 而 成 为 话题 ; 留 下 的 空位 必 
须 用 续 指 代词 “他 ”等 填充 ;例如 : 
陈 先生 ,小 方 问 过 他 股票 行情 
结婚 的 ， 我 都 送 他 们 一 一 套 炊 具 
(8) 不 作 “V- 成 ”- 类 复合 动词 的 宾语 * 例 如 ， 
* 问 成 小 刘 一 件 事 |* 送 成 小 李 一 二 书 
7. 结果 
《1) 作 基 础 句 的 宾语 ,不 作 双 宾 语句 中 的 宾语 ,例如 : 
和 爸爸 在 院子 里 挖 了 一 口 井 | 小 王 在 上 琴 了 一 二 个 脚印 
妈妈 给 弟弟 织 了 一 一 件 毛衣 | 老 张 在 窗户 纸 上 捅 了 一 一 个 河 
(2) 作 *“ 把 ”等 介词 的 宾语 ,不 作 “ 为 .对 、 给 .向 、 替 ” 等 介词 的 宾 
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语 , 例 如 ; 
弟弟 把 纸 船 三 好 了 | 李 院 长 把 通知 写 黑板 上 了 
他 们 把 房子 盖 在 山坡 上 了 |* 李 院 长 为 通知 写 黑板 上 了 
* 第 弟 对 纸 船 登 好 了 | * 他 们 给 房子 盖 在 山坡 上 了 
x 李 院 长 向 通知 写 黑板 上 了 | x 弟弟 替 纸 船 重 好 了 
(3) 作 “ 被 ”字句 的 主语 ,例如 : 
房子 被 他 们 盖 好 了 | 便桥 被 工兵 一 夜 之 间架 起 来 了 
菜 窗 被 爸爸 挖 在 院子 里 
(4) 作 “VV、V 一 V” 等 重奏 形式 的 宾语 ,不 作 ^V 了 V” 等 重 又 
形式 的 宾语 ,例如 : 
做 (一 ) 做 饭 | 写 (一 ) 写 信 |* 做 了 做 饭 |# 写 了 写 信 
(5) 作 “ 不 VP> 和 “没有 VP” 等 否定 形式 的 宾语 ,例如 ; 
不 造 桥 一 没有 造 桥 | 不 做 米饭 一 没有 做 米饭 
(6) 不 作 基础 句 的 主语 ; 即 由 它 造 成 的 述 宾 结 构 不 能 转换 为 相 
应 的 主 谓 结 构 ,例如 : 
烧 米 饭 一 x 米饭 烧 | 制造 训 言 一 % 谣言 制造 
袜 忌 了 一 * 饺子 捍 
(7) 作 动 词 的 宾语 时 可 以 左 向 出 位 而 成 为 话题 , 留 下 的 空位 上 
不 能 填 和 人 续 指 代词 “他 ”等 形式 ; 作 介词 “把 ”的 宾语 时 可 以 
左 向 出 位 而 成 为 话题 * 原来 的 位 置 上 不 可 以 是 空位 ,这 个 空 
位 必须 用 续 指 代词 “他 ”等 填充 ;例如 : 
和 毛衣， 妈妈 早 就 为 我 织 好 [ 关 它 ] 了 
菜 客 ,和 葡 和 爸 已 经 挖 好 [# 它 ] 了 
招工 广告 ,我 把 它 写 在 大 门口 了 
百科 词典 ， 我 们 把 它 编 出 来 了 
(8) 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 ， 
抬 成 慢 头 | 做 成 工棚 | 挖 成 深 并 | 盖 成 电脑 超市 
8. 对 象 
(1) 作 基 础 句 的 宾语 , 作 双 宾语 句 中 的 近 宾 语 (间接 宾语 ); 例 
如 : 
弟弟 喜欢 西洋 美术 | 厂 长 欣赏 他 的 才能 
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(2) 


《3) 


(4) 


《5) 


〈6) 


6 


〈8) 


我 认识 他 们 老板 | 校长 非常 信任 李晓明 

我 们 喜欢 他 勤奋 踏实 | 大 伙 儿 讨厌 他 太 嗓 唆 

不 作 ” 把 等 介词 的 宾语 ,也 不 作 “ 为 、 对、 给 、 向 、 蔡 ”等 介词 
的 宾语 ,例如 

* 哥哥 把 漫画 喜欢 得 不 得 了 | * 妈妈 把 这 些 人 讨厌 透 了 

* 和 葡 爸 把 李 校 长 认识 了 | * 张 书记 把 李晓明 信任 极 了 

* 哥哥 为 漫画 喜欢 得 不 得 了 | * 妈妈 对 这 些 人 讨厌 透 了 

# 区 苞 给 李 校 长 认识 了 | * 张 书记 向 李晓明 信任 极 了 

* 哥哥 替 漫 画 喜 欢 得 不 得 了 

不 作 ”“ 被 ”字句 的 主语 ,例如 

老 陈 热 悉 财会 工作 一 * 财会 工作 被 老 陈 熟 悉 

我 相信 有 功能 主义 一 尖 功能 主义 被 我 相信 

哥哥 认识 小 方 ~ 尖 小 方 被 哥哥 认识 

不 作 “V( 瑟 灵 VCJ )V” 等 重 码 形 式 的 宾语 ,例如 ， 

尖 喜欢 (一 ) 喜 欢 评弹 | < 讨厌 (了 ) 讨 厌 说 教 

兴 信人 一 ) 信 西医 

作 ”“ 不 VP” 这 种 否定 形式 的 宾语 ;不 作 “ 没 有 VP?" 这 种 和 否定 
形式 的 宾语 ,例如 ; 

不 相信 群众 ~~* 没有 相信 群众 

不 喜欢 中 餐 ~ X 没有 喜欢 中 餐 

不 作 基础 句 的 主语 , 即 由 它 造成 的 述 宾 结 构 不 能 转换 为 相 
应 的 主 谓 结构 ,例如 

喜欢 大 山 一 < 大 山 喜 欢 | 讨厌 礼节 一 礼节 讨厌 

认识 你 爸 一 兴 你 爸 认 识 

作 动词 的 宾语 时 可 以 左 向 出 位 而 成 为 话题 ， 原来 的 位 置 上 
可 以 是 空位 , 留 下 的 空位 也 可 由 续 指 代 词 “ 他 ”等 形式 填充 ; 
例如 : 

西洋 画 , 我 喜欢 [这 种 东西 ] | 小 明 ， 我 讨厌 [他 ] 

那个 孩子 ， 我 认识 [她 ]| 这 些 家 伙 ; 我 融 悉 [他 们 ] 

不 作 “V- 成 ”一 一 类 复合 动词 的 宾语 ,例如 ， 

* 认识 成 小 李 | * 喜欢 成 漫画 
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9. 系 事 


《3 


(2) 


《3 


No 


〈4) 


《5) 


《6 


> 


《7 


〈8) 


作 基 础 句 的 宾语 ,有 时 作 双 宾语 句 中 的 远 宾 语 (直接 宾语 )， 
例如 : 

弟弟 是 北大 附中 的 学 生 | 这 些 房子 属于 地 质 学 院 

我 们 都 巴 他 华威 先生 | 工人 们 要 他 狗 奴 才 

不 作 *“ 把 ”等 介词 的 宾语 ,也 不 作 " 为 、 对 、 给 、 向 、 替 "等 介词 
的 宾语 ,例如 : 

哥哥 是 工人 一 # 本 可 把 工人 是 

这 些 房 子 属于 地 质 学 院 一 关 这 些 房子 为 地 质 学 院 属于 
知青 们 叫 我 妈 大 姐 一 * 知青 们 把 /对 /给 /向 / 亚 大 姐 叫 我 妈 
不 作 “ 被 字句 的 主语 ,例如 ， 

苹果 属于 水 果 一 关 水 果 被 苹果 属于 

在 平 菇 天 合生 因 和 和 入 妨 

老 陈 是 工会 主席 一 * 江 会 主席 被 老 陈 是 

不 作 *VV\V 一 V、V 了 V” 等 重奏 形 式 的 宾语 ,例如 : 

x 像 ( 一 ) 像 他 苑 | x 拥有 (了 ) 拥 有 财产 | * 是 (一 ) 是 师傅 
作 *“ 不 VP” 这 种 否定 形式 的 宾语 ,不 作 “ 没 有 VP” 这 种 否定 
形式 的 宾语 ,例如 ，: 

不 是 学 生 一 * 没有 是 学 生 | 不 属于 国家 僵 * 没 有 属于 国家 
不 作 基 础 句 的 主语 , 即 由 它 造 成 的 述 宾 结 构 不 能 转换 为 相 
应 的 主 谓 结构 ,例如 : 

像 大 山 一 * 大 山 像 | 有 力气 一 关 力 气 有 | 是 工人 一 * 工人 是 
作 动 词 的 宾语 时 一 般 不 能 左 向 出 位 而 成 为 话题 ,只 有 作 
“有 不 是 ?等 的 宾语 时 才 可 以 左 向 出 位 而 成 为 话题 、 留 下 的 
空位 不 能 由 续 指 代词 “他 ”等 填充 ;例如 : 

< 大 胖 能 ,你 简直 像 []|* 集体 ,荣誉 属于 [ 

x 狂热 分 子 , 我 是 C ] 一 狂热 分 子 , 我 不 是 [ | 毛笔, 我 有 5 ] 
不 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 ， 

x 是 成 厂 长 | # 属于 成 校方 


10. 工具 


(Cd 


作 介词 “用 ”的 宾语 ,整个 介 宾 结构 在 基础 句 中 放 在 动词 之 
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前 作 状 语 , 例 如 : 
和 苞 和 苞 用 小 刀 切 萝卜 | 区 和 苑 用 放大 镜 看 报纸 
(2) 不 作 介词 “把 ”的 宾语 ,例如 ; 
x 管 答 把 小 刀 切 萝卜 | * 和 苑 爷 把 放大 镜 看 报纸 
(3) 不 作 介词 “在 .从 、 到 ”等 的 宾语 ,例如 : 
# 和 苞 和 在 小 刀 切 蔓 下 | * 和 区 和 苑 从 放大 镜 看 报纸 
可 以 左 向 出 位 而 成 为 话题 , 留 下 的 空位 必须 用 续 指 代词 
“他 ?等 填充 ,或 者 把 介词 “用 ?删除 ,例如 : 
这 把 莽 子 ,叔叔 用 它 牙 业 | 这 副 眼 镜 , 我 看 电视 
可 以 右 向 出 位 (right dislocation) 而 成 为 述 题 , 即 紧 接 在 动 
词 之 后 作 宾语 , 留 在 原 位 的 介词 “用 ”必须 删除 ,例如 ; 
叔叔 下 这 把 径 子 | 你 看 这 个 望远镜 | 我 切 水 果 刀 
(6) 可 作 “VV” 等 重 到 形式 的 宾语 ,不 作 ^V 一 V\V 了 V2? 等 重 
琶 形 式 的 宾语 ,例如 : 
你 切切 这 把 刀 试 试 | 我 也 牙牙 这 把 作 子 
x 看 一 看 这 副 望 远 镜 | x 二 清 尖 出 人 入 


(4 


NS 


《5 


SS 


(7) 不 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 
* 切 成 水 果 刀 | * 看 成 那 副 眼 镜 

11. 材料 

(1) 作 介词 “用 ”的 宾语 ,整个 介 宾 结构 在 基础 句 中 放 在 动词 之 
前 作 状 语 , 例 如 : 
和 苞 苞 用 柳条 编 箱子 | 苑 苑 用 米 潜 水 浇 花 | 我 用 白灰 刷 墙 

(2) 作 介 词 “ 把 ”的 宾语 ,例如 : 
和 爸 爸 把 柳条 都 编 了 箱子 了 | 妈妈 把 米 滑 水 都 滋 了 花 了 
叔叔 把 白灰 全 刷 墙 上 了 

(3) 不 作 介 词 “ 在 .从 ` 到 ”等 的 宾语 ,例如 : 
* 区 爸 在 柳条 都 编 了 箱子 了 | 六 妈妈 从 米 消 水 都 搁 了 花 了 
* 叔叔 到 白灰 全 而 墙 上 了 

(4) 可 以 左 向 出 位 而 成 为 话题 , 留 下 的 空位 必须 用 续 指 代词 
“他 ?等 填充 ,或 者 把 介词 “用 ?删除 ,例如 : 
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这 些 柳 条 ,叔叔 用 它 编 花篮 | 这 些 米 滑 水 ,我 浇 兰 花 
(5) 五 可 以 右 向 出 位 而 成 为 述 题 ， 即 紧 接 在 动词 之 后 作 宾 语 , 留 在 
原 位 的 介词 “用 ”必须 删除 ,例如 : 
叔叔 正 编 柳条 呢 | 这 金兰 花 我 涪 米 水 水 | 我 和 爸 正 刷 石 灰 水 呢 
(6) 可 作 “VV” 等 重 夺 形 式 的 宾语 ,不 作 “V 一 VV 了 V” 等 重 
奢 形 式 的 宾语 ,例如 : 
晚上 没事 就 编 编 柳条 | 你 来 剧 刷 这 种 石灰 水 
< 编 一 编 柳条 |* 滋 了 浇 米 消 水 | * 编 了 编 柳 条 
《7) 不 作 ”V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 
12. 方式 
(1) 作 介词 "用 "的 宾语 ,整个 介 宾 结 构 在 基础 句 中 放 在 动词 之 
前 作 状 语 ,例如 : 
和 爸爸 用 低音 喝 了 一 首 民歌 | 和 区 和 苑 用 三 角 包 包 糖 果 
王蒙 用 意识 流 写 小 说 | 好 用 花 腔 喝 《茶花 女 》 
〈2) 不 作 介词 “把 ”的 宾语 ,例如 : 
* 区 和 爸 把 低音 喝 了 一 首 民 歌 |x 区 和 苑 把 三 角 包 包 糖 果 
x 王蒙 把 意识 流 写 写 小 说 |< 她 把 花 腔 喝 《 茶 花 女 》 
(3) 不 作 介词 “在 \ 从 、 到 ”等 的 宾语 ;例如 
* 笃 爸 在 低音 喝 了 一 首 民歌 | * 区 和 区 在 三 角 包 包 糖 果 
兴 王蒙 到 意识 流 写 小 说 |* 她 从 花 腔 昌 ( 茶 花 女 》 
不 能 左 向 出 位 而 成 为 话题 ,例如 
x 低音 ,和 葡 区 用 它 喝 了 一 首 民歌 
# 三 角 包 ， 和 区 和 苑 用 它 包 糖果 
< 意识 流 , 王 蒙 用 它 写 小 说 
x 花 腔 ， 王 芳 用 它 喝 ( 茶 花 女 》 
可 以 右 向 出 位 而 成 为 述 题 , 即 紧 接 在 动词 之 后 作 宾语 , 留 在 
原 位 的 介词 “用 ”必须 删除 ,例如 ; 
刘刚 喝 低音 , 张 平 喝 高 音 | 和 区 和 爷 正 包 三 角 包 呢 
他 尝试 写意 识 流 | 这 条 被 子 ， 我 捆 间 字 
(6) 不 作 *VV\V - V\V 了 V” 等 重 蚕 形式 的 宾语 ,例如 : 
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x 晚上 没事 就 喝 喝 低 音 |? 你 来 包 包 这 种 三 角 包 | 
* 喝 一 喝 花 腔 | x 写 一 写意 识 流 

x 喝 了 喝 高 音 | x 捆 了 捆 双 十 字 

可 以 作 *“V- 成 ”一 类 复合 动词 的 宾语 ,例如 

喝 成 高 音 了 | 包 成 三 角 包 | 捆 成 并 字 


13. 场所 
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作 介 词 “ 在 ”的 宾语 ,整个 介 宾 结构 在 基础 句 中 放 在 动词 之 
前 作 状 语 , 例 如 : 

黄 斌 在 里 较 跑 | 和 公务 在 食堂 吃 中 饭 

老 修 在 江湖 上 冶 荡 了 几 十 年 

老 陈 在 地 板 上 唾 | 张 书记 老 在 乡下 住 

不 作 介词 “把 .用 ?等 的 宾语 ,例如 ， 

* 黄 斌 把 里 园 跑 | * 区 区 把 食堂 (里 ) 吃 中 饭 

x 老 陈 用 地 板 上 睡 | x x 张 书记 老 用 乡下 住 

不 作 介词 “从 、 往 .向 ”等 的 宾语 ,例如 ， 

< 黄 斌 从 里 较 跑 | * 和 区 区 从 食堂 (里 ) 吃 中 饭 

*x 老 陈 往 地 板 上 睡 | x 张 书记 老 往 乡下 住 

不 能 左 向 出 位 而 成 为 话题 ,例如 : 

* 里 较 , 黄 斌 在 那儿 跑 |# 食堂 (里 ), 苑 和 区 在 那儿 吃 中 饭 

x 地 板 上 ， 老 陈 在 那儿 睡 | > 乡下 ， 张 书 记 老 在 那儿 住 

可 以 右 向 出 位 而 成 为 述 题 ， 即 紧 接 在 动词 之 后 作 宾语 ;这 
时 ,附着 在 处 所 性 成 分 之 后 的 方位 词 必须 删除 , 留 在 原 位 的 
介词 也 必须 删除 ;例如 

黄 斌 跑 里 园 , 刘 虹 跑 外 团 | 季 和 爷 老 吃 食堂 

老 陈 经 常 睡 地 板 | 张 书记 老 住 乡 下 | 老 候 阁 荡 江 湖 几 十 年 
作 *VV、V 一 V” 等 重 又 形式 的 宾语 ,不 作 “V 了 V” 等 重 友 
形式 的 宾语 ,例如 : 

你 跑 ( 一 ) 跑 外 轿 看 | 你 吃 ( 一 ) 吃 食堂 看 

x 老 陈 睡 了 睡 地 板 | * 黄 斌 跑 了 跑 里 转 

x 张 书记 住 了 住 乡下 | * 我 也 吃 了 吃食 堂 

不 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 
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* 跑 成 里 较 | * 吃 成 食堂 
14. 源 点 
(1) 作 介词 “从 ”的 宾语 ,整个 介 宾 结构 在 基础 句 中 放 在 动词 之 
前 作 状 语 ; 或 者 作 介词 “于 ”的 宾语 ,整个 介 宾 结构 在 基础 名 
中 放 在 动词 之 后 作 补 语 。 例 如 : 
一 个 犯人 从 监狱 里 路 了 | 一 只 网 更 从 笼子 里 飞 了 
长 江 发 源 于 青藏 高 原 | 科举 制度 起 源 于 隋唐 
(2)“ 离 开 ” 等 极 少数 动词 的 源 点 只 能 作 宾语 ,例如 : 
父亲 十 八 岁 就 离开 了 故乡 | 代表 团 离 开 北京 去 广州 参观 
(3) 不 作 介 词 “ 把 .用 ?等 的 宾语 ,例如 : 
< 一 个 犯人 把 监狱 里 跑 了 | 一 只 网 葡 用 笼子 里 飞 了 
x 长 江 发 源 把 青藏 高 原 | * 科举 制度 起 源 用 隋唐 
(4) 不 作 介 词 “ 在 、 往 、 到 ?等 的 宾语 ,例如 : 
* 一 个 犯人 在 监狱 里 跑 了 | * 一 只 网 玖 往 笼子 里 飞 了 
x 长 江 发 源 在 青藏 高 原 | * 科举 制度 起 源 往 隋 唐 
用 介词 “从 ?引导 的 源 点 可 以 左 向 出 位 而 成 为 话题 , 留 在 原 
位 的 介词 “从 ”必须 删除 ;同时 , 跟 源 点 相应 的 施 事 或 主事 必 
须 通过 述 题 化 而 移 到 动词 之 后 作 宾 语 ;用 介词 “于 ?引导 的 
源 点 不 能 左 向 出 位 而 成 为 话题 ;例如 : 
监狱 里 跑 了 一 一 个 犯人 | 区 子 里 飞 了 一 只 网 部 
x 青藏 高 原 ， 长 江 发 源 于 此 | > 类 隋唐 ,科举 制度 起 源 于 那 时 
《6) 不 能 右 向 出 位 而 成 为 述 题 ， 例如 ; 
x 一 个 犯人 跑 了 监狱 (里 )| 闪 一 只 鸥 鳌 飞 了 范 子 (里 ) 
* 长 江 发 源 青 藏 高 原 | x 科举 制度 起 源 隋唐 
(7) 不 作 “VV\V 一 V\V 了 V2” 等 重奏 形式 的 宾语 ,例如 : 
x 跑 ( 一 ) 跑 监狱 | x 飞 (一 ) 飞 秒 子 |x 跑 了 跑 监狱 
x 飞 了 飞 笼子 |* 发 源 发 源 青藏 高 原 | # 起 源 了 起 源 唐 朝 
《8) 不 作 ”V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 
< 跑 成 监狱 里 |* 起 源 成 唐 朝 
0 5 
〈1) 作 介 词 “ 向 、 往 ?等 的 宾语 ,整个 介 宾 结构 在 基础 句 中 放 在 动 
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词 之 前 作 状 语 ;或 者 作 介 词 “ 到 向 、 往 \ 在 ”等 的 宾语 ,整个 
介 宾 结构 在 基础 句 中 放 在 动词 之 后 作 补 语 ;例如 : 
他 们 向 科学 高 峰 攀 登 | 她 往 书 架 上 插 书 
这 赵 车 开 往 齐齐哈尔 | 刘 坏 把 书 放 在 家 里 了 
“去 、 到 、 到 达 ” 等 少数 动词 的 终点 只 能 作 宾语 ,例如 : 
小 王 去 图 书馆 了 | 孩子 到 姥姥 家 了 | 他 们 明天 到 达 深 圳 
《3) 不 作 介词 把"“ 用 ”等 的 宾语 ,例如 : 
< 他 们 把 科学 高 峰 攀 登 | * 她 用 书架 上 揪 书 
(4) 不 作 介词 “从 ”等 的 宾语 ,例如 ， 
x 他 们 从 科学 高 峰 攀 登 | * 她 从 书架 上 播 书 
(5) 能 用 介词 “在 引导 的 终点 可 以 左 向 出 位 而 成 为 话题 , 留 在 
原 位 的 介词 “在 ”必须 删除 ;能 用 介词 “到 ?引导 的 终点 可 以 
左 向 出 位 而 成 为 话题 , 留 下 原 位 的 介词 “到 ”必须 删除 ,同时 
跟 终 点 相应 的 施 事 必须 通过 述 题 化 而 移 到 动词 之 后 作 宾 
语 ; 用 介词 “ 往 \ 向 、` 到 ”等 介词 引导 的 终点 ;不 能 左 向 出 位 而 
成 为 话题 。 例 如 
小 明 在 桌 上 放 了 一 本 书信 课 上 小 明 放 了 一 本 书 
两 个 乡 干部 来 到 我 们 村 一 我 们 村 来 了 两 个 乡 干部 
这 趟 车 开 往 齐 齐 哈 尔 一 关 齐 齐 哈 尔 , 这 趟 车 开 往 [ 那 儿 ] 
他 们 向 科学 高 峰 攀 登 ~ 科学 高 峰 ， 他 们 人 攀登 [ 那 儿 ] 
(6) 可 以 右 向 出 位 而 成 为 述 题 , 例 如 
他 们 勇敢 地 仙 登科 学 高 峰 | 那 本 书 ， 她 插 书 架 上 了 
这 趟 车 开 齐齐哈尔 | 老 刘 把 资料 搁 家 里 了 
(7) 不 作 “VV、V 一 V.V 了 V” 等 重 春 形式 的 宾语 ;例如 ， 
x 插 ( 一 ) 插 书架 (上 )|* 开 ( 一 ) 开 齐 齐 哈 灰 
* 搁 了 搁 家 里 |#* 坐 了 坐 沙发 (上 ) 
* 攀登 了 沧 登 科学 高 峰 | x 放 了 放 素 子 (上 ) 
(8) 不 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 
“攀登 成 科学 高 呼 | x 揪 成 书架 上 | * 开 成 齐 齐 哈 汞 
* 拥 成 家 里 


2 
NM 
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16. 范围 

(1) 作 基 础 句 的 宾语 ,有 时 作 双 宾语 句 中 的 远 宾 语 ,例如 : 
这 把 椅子 卖 两 百 块 钱 | 那 套房 子 值 四 五 十 万 
这 辆 车 一 天 跑 了 几 百 里 | 炸弹 偏离 目标 三 十 米 
会 议 持续 了 三 个 小 时 | 双方 僵持 了 半年 


《2)“ 休 息 、 值 ( 班 )” 等 极 少数 动词 的 表示 时 间 的 范围 论 元 ,通常 
在 介词 “在 ”的 引导 下 作 状 语 , 但 也 可 以 右 向 出 位 通过 述 题 


化 而 成 为 宾语 ,例如 : 
他 们 在 星期 天 休息 一 他 们 休息 星期 天 
老 王 在 星期 六 值 ( 班 ) ,我 在 星期 天 值 ( 班 ) ~ 
老 王 值 星期 六 ,我 值 是 期 天 
(3 


Se 


的 宾语 ,也 不 作 介词 “在 .从 、 到 、 往 ?等 的 宾语 ;例如 : 
x 这 辆 车 一 天 为 几 百 里 跑 
x 炸弹 从 / 往 / 在 /到 三 十 米 偏离 目标 
(4) 不 作 “ 被 ?字句 的 主语 ,例如 : 
x 两 百 块 钱 被 这 把 椅子 买 | * 四 五 十 万 被 那 套 房子 什 
x 几 百 里 被 这 辆 车 一 天 跑 | * 三 十 米 被 炸弹 偏离 目标 
(5) 不 作 ”“ 被 .由 ?等 介词 的 宾语 ,例如 ， 
x 这 把 桂子 被 两 百 块 钱 买 | * 那 套 房子 被 四 五 十 万 什 
< 这 辆 车 一 天 由 几 百 里 跑 |x 炸 弹 由 三 十 米 偏离 目标 
(6) 不 作 “VV\V 一 V\V 了 V?” 等 重奏 形式 的 宾语 ,例如 : 
关 买 (一 ) 买 两 百 块 钱 | * 值 (一 ) 值 四 五 十 万 
* 跑 了 跑 几 百 里 | * 偏离 了 偏离 三 十 米 
《7) 一 般 不 能 左 向 出 位 而 成 为 话题 ,例如 ; 
* 两 百 块 钱 ,这 把 椅子 买 |? 四 五 十 万 , 那 套房 子 值 
x 八 百 里 , 这 辆 车 一 天 跑 了 | * 三 十 米 , 炸 弹 偏 离 目标 
(8) 不 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 
* 买 成 两 百 块 钱 | * 值 成 四 十 万 | * 跑 成 几 百 里 
* 偏离 成 三 十 炒 


不 作 “ 把 .用 ”等 介词 的 宾语 ,不 作为 对 、 给 、 向 、 蔡 ”等 介词 
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17. 命题 
〈1) 作 基 础 句 的 主语 或 宾语 , 作 主 语 时 可 以 用 代词 “这 ( 事 ) 、 那 


《2 


《3 


(4 


《5 


(6 


) 


) 


) 


) 


SS 


〈 事 ) ”等 来 称 代 和 替换 , 作 宾语 或 宾语 补足 语 时 可 用 “这 样 
做) \ 那 样 ( 做 )” 等 形式 来 称 代 和 替换 。 例 如 : 

老 王 旷工 影响 了 生产 进度 一 这 ( 事 ) 影 响 了 生产 进度 
人 一 于 (可 ) 总 动 了 学 人 


ee 


大 伙 儿 认为 和 法 理 一 一 大 伙 儿 认为 这 样 /这 样 认为 
他 们 企图 从 青 后 下 手 ~ 人 那样 (做 ) 


他 们 过 使 我 闪 弃 学 位 他 们 过 使 我 这 样 (做 ) 
不 作 “ 描 、 用 ”等 介词 的 宾语 ,不 作 “ 为 、 对 、 给 \ 向 、 蔡 ”等 介词 
的 宾语 ,也 不 作 介词 “在 .从 到 、 往 ?等 的 宾语 ,例如 : 
< 他 们 把 那个 地 方 不 错觉 得 | * 大 伙 儿 用 我 没 理 认为 


不 作 “ 被 ”字句 的 主语 ,例如 
x 那个 地 方 不 错 被 他 们 觉得 | x 我 没 理 被 大 伙 儿 认为 


不 作 “ 被 、 由 ”等 介词 的 宾语 ,例如 : 
x 生产 进度 被 老 王 旷工 影响 了 
9 六 沁 次 和光 下 二 风 

5 和 汪 害 六 峰 玫 间 帮 二 格 和 


本 


不 作 *VV.V 一 YY 了 V" 等 重生 形式 的 宾语 ,例如 ， 
* 觉得 (一 ) 觉 得 那 地 方 不 错 | x 认为 (一 ) 认 为 我 没 理 


* 企图 了 企图 从 背后 下 于 | * 打算 了 打算 盖 一 讼 楼房 

作 主 语 时 可 以 左 向 出 位 而 成 为 话题 , 留 下 的 空位 可 以 用 续 
指 代 词 “ 这 / 那 ( 事 )? 等 填充 ; 作 宾语 时 不 能 左 向 出 位 而 成 为 
话题 ,但 可 以 通过 易 位 而 前 置 到 主语 之 前 ;例如 : 


老 王 旷工 [这 ( 事 门 影响 了 生产 进度 
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刘 老 师 带 病 上 课 ,[ 那 ( 事 门 感动 了 学 生 


我 没 理 ?大 伙 儿 认为 一 x 我 没 理 ,大 伙 儿 [这 样 ] 认 为 
从 背后 下 手 ? 他 们 企图 一 * 从 背后 下 手 , 他 们 企图 [那样 


(做 7 
盖 一 座 楼 房 * 弟 弟 打算 一 x 盖 一 座 楼 房 , 弟 弟 打算 [那样 
(做 7 
放弃 学 位 ?他 们 迫使 我 一 * 放弃 学 位 ,他 们 迫使 我 [这 样 
(做 7 


《7) 不 作 “V- 成 ”一 类 复合 动词 的 宾语 ,例如 : 


x 迫使 成 我 效 弃 学 位 
3 论 元 角色 的 句法 功能 和 范畴 约束 


上 文 试图 以 各 别论 元 角色 的 语法 表现 为 参考 索引 (reference in- 
dex) ,从 语法 形式 上 来 限定 17 种 常见 的 论 元 角色 的 疆界 。 事 实 上 ， 
论 元 角色 的 语法 表现 至 少 包 括 句法 功能 (Csyntactic function) 和 范畴 
特征 (categorical feature) 两 个 方面 : 前 者 指 各 个 论 元 角色 在 句子 中 
各 自 可 以 充当 什么 样 的 句法 成 分 (比如 : 主语 、 宾 语 、 状 语 ) ,充当 什 
么 样 的 句法 形式 的 主语 和 宾语 (比如 : 作 什 么 样 的 介词 或 动词 重 玲 
式 的 宾语 , 作 什 么 样 的 语法 形式 的 主语 ); 后 者 指 各 个 论 元 角色 通常 
由 什么 样 的 词类 范畴 来 实现 ,比如 : 施 事 、 受 事 通常 由 名 词性 成 分 来 
实现 , 致 事 通常 由 名 词 或 动词 性 成 分 来 实现 ,场所 、 源 点 、 终 点 通常 由 
处 所 性 成 分 来 实现 。 虽 然 这 种 论 元 角色 的 范畴 约束 也 是 识别 不 同 的 
论 元 角色 的 一 种 重要 的 语法 指标 ,但 是 由 于 不 同 的 论 元 角色 在 对 词 
类 范畴 的 选择 性 方面 似乎 差别 不 大 ` 好 像 都 以 名 词性 成 分 为 主要 的 


@ 例句 中 间 左 上 方 的 ”号 表示 句法 成 分 易 位 的 边界 ,那儿 通常 不 允许 有 较 长 的 停 
顿 。 
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实现 形式 ;加 上 我 们 在 这 方面 的 研究 工作 还 做 得 不 够 ,因此 现在 暂时 
付 诸 阙 如 。 和 希望 今后 有 机 会 能 够 进一步 挖掘 这 方面 的 语法 表现 ,来 
弥补 这 种 欠缺 。 


鸣谢 : 我 的 同事 诬 卫 东 先 生 提 议和 催促 我 做 这 个 课题 ,在 此 说 
向 他 表示 诚挚 的 谢意 。 
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汉语 谓词 的 论 元 结构 的 描述 框 砍 


本 文通 过 十 个 具体 的 例子 ,来 说 明 怎 样 来 建立 汉语 谓词 (动词 、 形 容 
词 \ 有 价 名 词 ) 的 论 元 结构 的 描述 框架 。 内 容 包 括 (i 谓词 的 论 元 属性 ( 价 
数 ),(ii) 这 些 论 元 的 论 旨 属性 (语义 格 ) ,Ciii) 这 些 论 元 角色 的 词类 范畴 特 
性 和 和 句法 特性 (成 分 功能 ),(iv) 充当 这 些 论 元 角色 的 词语 的 语义 特性 ， 
Cv) 谓词 及 其 论 元 的 句法 配置 方式 及 其 典型 格式 和 例句 。 


0 引 才 


袁 匀 林 (2002) 指 出 ,动词 的 论 元 结构 的 主要 内 容 应 该 包括 ， 


(1) 论 元 属性 : 确定 每 一 个 动词 能 支配 多 少 个 必用 论 元 、 
多 少 个 可 用 论 元 ; 
(2) 论 旨 属性 : 标定 这 些 论 元 在 语义 上 的 功能 , 即 论 旨 角 
色 ; 
(3) 语法 特征 : 描写 这 些 论 元 在 句法 上 的 功能 和 所 受到 的 
名 法 约束 ; 
(4) 语义 特征 : 描写 这 些 论 元 的 动态 的 语义 特征 和 静态 的 
语义 特征 ; 
(5) 配 位 方式 : 描写 动词 及 其 论 元 的 句法 配置 方式 。 
其 中 , 论 元 属性 (argument property) 指 的 是 动词 所 能 关联 的 论 
元 的 数目 ,通俗 地 说 就 是 价 数 。 为 了 尽 可 能 精确 和 细密 ,我 们 用 喜 包 
林 (1998: 100) 的 “ 联 、 项 位、 元 ?这 种 配 价 层 级 作 框架 。 具 体 地 说 ， 
联 指 一 个 动词 在 各 种 句子 中 所 能 关联 的 语义 角色 不 同 的 名 词性 成 分 
的 数量 ,项 指 一 个 动词 在 一 个 句子 中 所 能 关联 的 名 词性 成 分 的 数量 
(其 中 包括 通过 介词 引导 的 名 词性 成 分 ), 位 指 一 个 动词 在 一 个 句子 
中 不 借助 介词 所 能 关联 的 名 词性 成 分 的 数量 ,元 指 一 个 动词 在 一 个 
简单 的 基础 句 中 所 能 关联 的 名 词性 成 分 的 数量 。 
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论 旨 属性 (thematic property) 指 的 是 各 个 论 元 的 论 旨 角色 , 通 
俗 地 说 就 是 语义 格 (Ccase) 。 

语法 特征 《grammatical feature) 包括 名 法 功能 (syntactic func- 
tion) 和 范畴 特征 (categorical feature) 两 个 方面 ,前 者 指 各 个 论 元 在 
句子 中 各 自 可 以 充当 什么 样 的 句法 成 分 (比如 : 主语 、 宾 语 、 状 
语 ), 后 者 指 各 个 论 元 通常 由 什么 样 的 词类 范畴 来 实现 (比如 : 施 
事 、 受 事 通常 由 名 词性 成 分 来 实现 , 致 事 通常 由 名 词 或 动词 性 成 分 
来 实现 ,场所 、 源 点 、 终 点 通常 由 处 所 词 .方位 词 等 处 所 性 成 分 来 实 
现 )。 

语义 特征 Csemantic feature) 包 括 动态 的 语义 特征 和 静态 的 语义 
特征 两 个 方面 ,前 者 指 的 是 各 个 论 元 在 述 谓 结构 中 表现 出 来 的 施 动 
性 、 受 动 性 等 语义 特点 ,后 者 指 实现 不 同 的 论 旨 角色 的 词语 在 语义 上 
受到 的 约束 (比如 : 施 事 ,. 与 事 通常 由 指 人 名 词 来 实现 , 受 事 则 既 可 
以 由 指 人 名 词 来 实现 ,也 可 以 由 指 物 名 词 来 实现 ) 。 

配 位 方式 (argument selection) 指 的 是 依存 于 同一 个 动词 的 各 
个 论 元 在 句子 中 的 共 现 和 选择 限制 , 即 怎样 构成 一 个 或 几 个 相关 的 
句 式 ,也 就 是 说 ,动词 及 其 论 元 角色 的 句法 配置 方式 必须 注意 的 
是 ,所 谓 动 词 的 论 元 结构 实际 上 指 的 是 动词 的 某 个 义 项 或 义 位 
Msememe) 的 论 元 结构 ,也 就 是 说 ,同一 个 动词 的 不 同 义 位 可 能 具有 
各 不 相同 的 论 元 结构 。 

我 们 认为 ,这 些 内 容 对 于 掌握 动词 的 意义 和 用 法 ,起 着 至 关 重 要 
的 作用 。 甚 至 可 以 说 ,说 母语 者 正 是 拥有 了 这 些 知 识 , 才 得 以 正确 地 
遗 词 造句 和 听 读 理解 ;一 个 外 族 学 习 者 只 有 了 解 了 这 些 知 识 , 才 能 用 
这 些 词 来 造句 或 理解 包含 这 些 词 的 语句 。 同 样 , 计 算 机 要 理解 自然 
语言 ,这 种 结构 化 的 论 元 结构 知识 是 必 不 可 少 的 。 

本 文 打算 通过 十 个 具体 的 例子 ,来 说 明 怎 样 来 建立 汉语 谓词 的 
论 元 结构 的 描述 框架 。 其 中 ,各 种 论 元 角色 的 动态 的 语义 特征 ,已 经 
在 圳 航 林 (2002) 作 了 总 的 讨论 ,不 必要 在 每 个 动词 十 重复 二 下 ,这 里 
从 略 。 必 须 说 明 的 是 ,这 里 所 谓 的 谓词 除了 指 动词 和 形容 词 之 外 ,还 
包括 有 价 名 词 。 
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1. 切 : qi6,( 动 词 ? 用 刀 把 物品 分 成 若干 部 分 

C1] 论 元 属性 : 二 元 三 位 四 项 六 联动 词 , 记 作 : V: 2 一 3 一 4 一 6; 
或 称 : 二 元 六 系 动词 , 记 作 V: 2 一 6, 或 V2“。 

[2] 论 旨 属性 : { 施 事 A, 受 事 P, 结果 及 , 方式 M, 工具 I， 处 
所 工 ), 记 作 : V: {(A, P, R,，M,，I,，L)}; 其 中 ,结果 有 是 受 事 P 和 方 
式 M 的 合并 , 记 作 : R=P 十 M, 如 “黄瓜 片 儿 、 辣 椒 丝 儿 ” 等 。 

[3] 范畴 特性 : 均 为 名 词性 成 分 , 记 作 : A，P, R，M,，I,，L 一 
NP; 其 中 ,L 只 能 是 名 词 和 方位 词 构成 的 复合 处 所 词 , 如 :“ 案 板 上 ， 
碟子 里 ”。 

[4] 句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 ; 受 事 P 和 结果 
有 方式 M 分 别 实现 为 宾语 ;工具 工 实现 为 状语 中 介词 “用 ”的 宾语 ; 
处 所 工 只 有 在 派生 名 中 才能 出 现 ,实现 为 宾语 或 主语 。 记 作 : A 一 
Sub;P，R，M ~ Obj;I-> Prep 十 Obj;L - Obj/Sub。 

[5] 语义 特性 : A ~ NPL 十 Human];M 一 NPL 十 Abstract]， 
如 “ 片 儿 、 丝 儿 ? 等 ;I>NP[L 十 Tool], 如 “万 用、 菜刀 ”等 让 一 NP[ 十 
Place] ,如 “和 案板 上 、 碟 子 里 ?等 。 

[6] 句法 配置 :“ 切 ”及 其 论 元 能 构成 下 列 句 式 ， 

S1: A 十 用 I 十 十 P/R 

S2: I+A 十 十 P/R 

S3 ::P 十 A 十 二 本 M 

8S 作 太 十 把 BR 妥 计 和 斗 了 

S5::R 二 A 二 证 开 

S65 开本 了 寺 R 

S7: A 十 用 I 十 把 及 十 ; 洁 在 开 


说 明 : 其 中 , 斜 撤 / 表 示 析 取 (disjunction) 关 系 。 
[7] 典型 句 式 : 


S1: 他 用 小 刀 一 黄瓜 /黄瓜 片 
S2: 这 把 刀 我 一 黄瓜 /黄瓜 片 
S3: 这 根 黄 瓜 你 一 丝 儿 / 片 儿 
S4: 他 把 黄瓜 片 儿 一 案板 上 了 
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S5: 黄瓜 片 儿 他 一 案板 上 了 
S6 : 案板 上 一 了 不 少 黄瓜 片 儿 
S7: 小 刚 用 水 果 刀 把 黄瓜 片 儿 全 一 案板 上 了 


58] 真实 例句 :《〈 略 ) 


2. 包 : b5o, (动词 ?通过 包 庄 的 方式 制作 食品 

[1] 论 元 属性 : 二 元 三 位 (三 项 三 联 ) 动 词 , 记 作 : V: 2 一 3 (一 
3 一 3) ;或 称 : 二 元 三 系 动 词 , 记 作 : V: 2 一 3, 或 V 。 

说 明 : 当 联 的 数目 等 于 项 时 ,可 以 只 标记 到 项 ;同样 , 当 项 的 数 
目 等 于 位 时 ,可 以 只 标记 到 位 ; 依 此 类 推 , 当 位 的 数目 等 于 元 时 ,可 以 
只 标记 到 元 。 也 就 是 说 ,上 面 圆 括号 中 的 数目 是 可 以 省 略 的 。 

KEO 论 旨 属性 : { 施 事 A， 结果 及， 材料 Ma}, 记 作 : V: (AR， 
Ma ) 。 . 

[3] 范畴 特性 : 均 为 名 词性 成 分 , 记 作 : A, 了，Ma 一 NP。 

[4] 句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 ,结果 有 实现 为 
宾语 ,材料 Ma 实现 为 状语 中 介词 “用 ”的 宾语 ;在 派生 句 中 ,结果 及 
和 材料 Ma 可 以 实现 为 大 主语 (话题 ) 。 记 作 : A, R，Ma 一 Sub;P， 
R ~ Obj;Ma -> Prep 十 Obj。 

[5] 语义 特性 : A ~ NP[ 十 Human],R 一 NPL 十 Food], 如 “ 饺 
子 、 旬 钝 、 粽 子 ";Ma -> NP[ 十 Grain], 如 “面粉 .粳米 ( 粉 )” 等 ,有 时 ， 
像 * 竹 叶 、 竹 敌 ? 等 不 具有 [十 Grain] 特 征 的 词语 也 可 以 充当 这 种 材料 
格 , 如 :妈妈 用 人 竹 叶 包 粽子 | 这 些 竹 敌 我 们 包 粽 子 吧 ”。 为 了 区 别 ,前 
者 可 以 称 为 内 容 性 (content) 材 料 , 记 作 Ma(Con); 后 者 可 以 称 为 工 
具 性 (tool) 材 料 , 记 作 Ma(Tol) 。 

[6] 句法 配置 :“ 包 ”及 其 论 元 能 构成 下 列 句 式 : 


S1: A 十 用 Ma 十 ， 十 R 
S2, Ma 二 A 十 “十 R 

S3;, R 二 AT _ 了 … 

S4: A 十 把 Ma 二 了 十 R 


说 明 : S4 中 的 材料 Ma 一 般 只 能 是 内 容 性 材料 MaCCon) ,而 不 
能 是 工具 性 材料 MaCTol) 。 
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[7] 典型 句 式 : 


S1: 妈妈 用 那些 面粉 一 了 几 十 只 饺子 

S2: 这 些 馅 儿 我 一 锟 钝 | 这 些 竹 敌我 们 一 粽子 
S33: 信子 我 一 了 一 些 

S4: 他 把 馅 儿 一 了 饺子 了 


C8] 真实 例句 :〈 略 ) 


3, 包 : b5o, (动词 ?用 纸 , 布 等 东西 把 东西 包 庄 起 来 

[1 论 元 属性 : 二 元 三 位 (三 项 ) 四 联动 词 , 记 作 : V: 2 一 3 (一 
3) 一 4; 或 称 : 二 元 四 系 动词 , 记 作 : V: 2 一 4, 或 V “。 

[2] 论 旨 属性 :( 施 事 A, 受 事 P, 材料 Ma, 方式 M}, 记 作 : V: 
(A，R，Ma，M) 。 

说 明 : 这 里 的 材料 Ma 一 般 只 能 是 工具 性 材料 Ma(Tol) ,而 不 
能 是 内 容 性 材料 Ma(CCon) 。 

[3] 范畴 特性 : 均 为 名 词性 成 分 , 记 作 : A,R，Ma,，M 一 NP。 

[4] 句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 , 受 事 了 实现 为 
宾语 ,材料 Ma 实现 为 状语 中 介词 “用 ”的 宾语 ;在 派生 句 中 , 受 事 了 
和 材料 Ma 可 以 实现 为 大 主语 (话题 ) ,方式 M 和 材料 Ma 可 以 实现 
为 宾语 。 记 作 : A，P，Ma -一 Sub;P，Ma，M -~ Obj; Ma 一 Prep 十 
Obj 。 

[5] 语义 特性 : A ~ NPL 十 Human],Ma 一 NPL 十 Thin，Two- 
dimensions], 如 “和 牛皮纸、 塑料 布 \ 荷 时 、 彩 纸 ” 等 ,M 一 NPL 十 Ab- 
stract], 如 小包、 三角 包 、 双 十 字 ” 等 。 

56] 句法 配置 :“ 包 ”及 其 论 元 能 构成 下 列 句 式 : 


S1: A 十 用 Ma 十 _ 十 P 
S2: Ma 十 A 十 _ 十 P 
S3: P 十 A 十 用 Ma 十 
S4: P 十 A 十 “十 Ma 
S5: PTA 十 _ 十 M 
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[7] 典型 句 式 : 


S1: 他 正 用 牛皮 纸 一 书 呢 

S2: 这 张 牛皮 纸 我 一 词典 

S3: 这 本 书 你 用 牛皮 纸 一 

S4: 这 本 书 你 一 牛皮 纸 

S5: 这 捆 书 你 一 双 十 字 | 这 些 糖 你 一 小 包 


58] 真实 例句 :〈 略 ) 


4, 调查 : diooch6, (动词 ?为 了 解 情况 进行 考察 

[1] 论 元 属性 : 立 元 三 位 (三 项 三 联 ) 动 词 只 BE 作 :， 贿 2 一 3 (于 
3 一 3 六 或 称 世 二 元 三 系 动 词 , 记 作 :2 一 3 或 V5 司 

[2 论 旨 属性 : { 施 事 A,， 受 事 P, 与 事 D, 命题 Pn)3 记 作 : V; 
《这 卫 g 瑟 冯 》 

[3] 范畴 特性 : 施 事 A， 受 事 P, 与 事 R 为 名 词性 成 分 , 记 作 : 
A, P,D NP; 命 题 Pn 为 谓词 性 成 分 或 小 句 , 记 作 Pn=>=: VP，S)。 

说 明 : S7 代 表 小 句 。 

[4] 句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 , 受 事 了 实现 为 
宾语 ;与 事 D 实现 为 状语 中 介词 “向 ?的 宾语 ;在 派生 句 中 ,与 事 D 可 
以 实现 为 宾语 , 受 事 P 可 以 实现 为 状语 中 的 介词 “为 了 ”的 宾语 ; 命 
题 Pn 只 能 实现 为 宾语 。 记 作 : A ~ Sub;jP, D, Pn ~ Obj;P,，D 一 
Prep 十 Obj。 另 外 “调查 ?是 名 动词 ,可 以 作 “ 作 、 进 行 2 等 形式 动词 
的 宾语 ; 记 作 : V -~ 进行 十 Obj。 

[5] 语义 特性 : A，D 一 NP[I 十 Human];P 一 NPLI 十 Ab- 
stract], 如" 情况、 事故 原因 ”等 ;Pn-> VP，S[ 十 Que]， 

说 明 : S[ 十 Que] 表 示 小 句 中 包括 “有 没有 、` 是 不 是 等 疑问 形 
式 。 

[6] 句法 配置 :调查 ”及 其 论 元 能 构成 下 列 句 式 : 


S1: A 十 向 D 十 十 P / Pn 
S2: A 十 为 了 P 十 _D 
S3: 为 了 P 二 A++_ 二 D 
S4: PTA 十 _ 二 D 
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So5 : 
S6 : 


A 十 为 了 了 P 十 向 D 十 进行 十 _ 
为 了 P 十 A 十 向 D 十 进行 十 _ 


57] 典型 句 式 : 


[8] 


(3 ;或 称 ; 


[2 
Ra ) 。 
[3] 


C4] 


不 多 忙 ”。 


[5] 语 


S1 : 
S2 : 
S3 : 
S4: 
S5 : 
S6 : 


警察 向 司机 一 事故 原因 /这 辆 小 公共 有 没有 超载 
警察 为 了 这 起 事故 一 了 许多 目击 者 

为 了 这 起 事故 警察 一 了 许多 目击 者 

这 起 事故 我 们 一 了 十 几 个 幸存 者 

民警 为 了 这 起 事故 向 一 些 目击 者 进行 一 

为 了 这 起 事故 民警 向 一 些 目击 者 进行 一 


真实 例句 :〈 略 ) 


sS.， 帮忙 : bangmdng, (动词 ?帮助 别人 做 事 
[1] 论 元 属性 : 一 元 二 位 三 项 (三 联 ) 动 词 , 记 作 : V: 1 一 2 一 3 


一 元 三 系 动 词 , 记 作 : V La ,或 Wai o 


论 旨 属性 :《 施 事 A, 与 事 D, 范围 Ra) , 记 作 : V: {(A,，D， 


范畴 特性 : 施 事 A 和 与 事 D 为 名 词性 成 分 , 记 作 : A,D -~ 
NP; 范 围 Ra 为 谓词 性 成 分 或 体 词 性 成 分 , 记 作 Ra -> VP/NP。 

句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 ,与 事 D 实现 为 
状语 中 介词 “给 ”的 宾语 。 由 于 “帮忙 ?是 离合 词 ,与 事 了 还 可 以 插 在 
“帮忙 ?的 中 间作“ 帮 ”的 间接 宾语 ， 忙 ?可 受 “ 一 些 . 不 少 ” 等 数量 词 
修饰 ;这 时 ,范围 ,Ra 可 以 作 主 语 , 如 “我 搬家 /这 件 事 ， 小玉 帮 了 (我 ) 


记 作 : A，Ra 一 Sub;jP，D 一 Prep 十 Obj。 
吾 义 特性 : A,，D ~ NP[L 十 Human];Ra 一 NP7VPL 十 


Thing/Event], 如 “这 件 事 、 搬 家 、 盖 房子 ”等 。 
[6] 句法 配置 :帮忙 ?及 其 论 元 能 构成 下 列 句 式 : 


S]1， 
S2 : 


二 
A 十 帮 了 /过 十 D 十 一 些 / 不 少 忙 


S3 : Ra 十 A 十 帮 了 /过 十 D 十 一 些 / 不 少 忙 


184 基于 认 知 的 汉语 计算 语言 学 研究 


57] 典型 句 式 : 


S1: 大 伙 几 给 老 张 一 
: 小 王 帮 了 /过 老 张 一 些 /不 少 忙 
S3 : 这 件 事 / 买 房子 我 帮 了 /过 老 张 一 些 / 不 少 忙 


58] 真实 例句 :《〈 略 ) 


6 帮忙 : bangmang, 形容词? 乐于 帮助 别人 

[1] 论 元 属性 : 一 元 二 位 (二 项 二 联 ) 形 容 词 , 记 作 : A: 1 一 2( 一 
2 一 2) ;或 称 : 一 元 二 系 形 容 词 , 记 作 : A: 1 一 2, 或 A 一 。 

[2] 论 旨 属性 : { 施 事 A, 与 事 D,， 范 围 Ra}, 记 作 : V: (A,，D， 
Ray) 。 

[3] 范畴 特性 : 施 事 A, 与 事 D 为 名 词性 成 分 , 记 作 : A，D 一 
NP; 范 围 Ra 为 谓词 性 成 分 或 体 词性 成 分 , 记 作 Ra - VP/NP。 

[4] 句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 ;与 事 D 实现 为 
状语 中 介词 “对 ”的 宾语 ;范围 Ra 可 以 作 大 主语 (话题 )。 如 “我 搬 
家 /这 件 事 , 小 王 对 我 很 帮忙 2; 也 可 以 舱 在 状语 “在 …… 上 ”中 ,如 : 
“在 提 干 这 件 事 上 , 王 部 长 很 帮忙 >?。 记 作 : A,，Ra 一 Sub;D 一 Prep 
十 Obj。 

另外 ,作为 形容 词 的 “帮忙 > 作 谓语 时 经 常 出 现在 “很 .非常 ?等 程 
度 副词 之 后 。 

[5] 语义 特性 : A, D ~ NPL 十 Human];Ra -> NPL 十 Thing/ 
Event], 如 “这 件 事 、 搬 家 、 盖 房子 ?等 。 

[6] 句法 配置 :帮忙 ?及 其 论 元 能 构成 下 列 句 式 

S1: A 十 对 D 十 很 _ 
S2: Ra 二 A 十 对 D+ 很 
S3: 在 Ra 上 十 A 十 对 D 十 很 _ 
[7] 典型 句 式 : 
S1: 小 王 对 我 很 一 
S2: 我 搬家 /这 件 事 , 小 王 对 我 很 一 
S3: 在 提 干 这 件 事 上 , 王 部 长 对 我 很 一 
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[8] 
冯 
辆 图 


真实 例句 :〈 略 ) 


飞 : f6i 动词) 飞 跑 , 即 通过 飞 的 方式 逃跑 
论 元 属性 : 一 元 二 位 三 项 (三 联 ) 动 词 , 记 作 : V : 2=3 


(一 3) ;或 称 : 一 元 三 系 动 词 , 记 作 : 3 


[2] 

作 3 V 
[3] 

NP。 
[4 


论 旨 属性 :《 施 事 A, 来 源 处 所 L(CS) ， 目 标 处 所 L(G)}, 记 
{ 人 CS 工 (G 当 。 
范畴 特性 : 均 为 名 词性 成 分 , 记 作 : A，L(S)，L(CG) ~ 


句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 ,来 源 处 所 工 


《S) 和 目标 处 所 L(G) 分 别 实现 为 状语 中 介词 “从 、` 到 ”的 宾语 ;在 泊 
生 句 中 来 源 处 所 LS) 可 以 实现 为 主语 ,目标 处 所 L(G) 可 以 实现 为 


宾语 ; 当 
A，L(S 
L55 


来 源 处 所 L(CS) 实 现 为 主语 时 , 施 事 A 实 现 为 宾语 。 记 作 : 
) 一 Sub;LCG)，A 一 Obj;L(CS)，LCG) 一 Prep 十 Ohbj。 
语义 特性 : A 一 NPL 十 Animal，Winged],L(S)，LKG) 一 


NPL 十 Place]。 


[6] 


C7] 


[8] 


句法 配置 : 飞 " 及 其 论 元 能 构成 下 列 句 式 : 
S1: A 十 _ 

S2: A 十 从 LICS) 十 _ 了 

S3: (从 )LCGS) 十 -了 十 A 

S4: A 十 -十 LCG)7 了 

S5: A 十 从 LS) 十 -十 LCG) 了 


典型 句 式 : 


S1] : 铝 子 一 了 

S2: 镶 子 从 鸟 乱 里 一 了 

S3: (从 ) 鸟 乱 里 一 了 一 只 铅 子 
S4: 鲍 子 一 (到 ) 屋 外 了 

S5: 铅 子 从 鸟 乱 里 一 (到 ) 屋 外 了 


真实 例句 :〈 略 ) 
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8. 飞 : f6i, (动词 ?由 飞 跑 造 成 丢失 
51] 论 元 属性 : 二 元 (二 位 二 项 二 联 ) 动 词 , 记 作 : V: 2( 一 2 一 
2 一 2) ;或 称 : 二 元 二 系 动 词 , 记 作 : V: 2 一 2, 或 V“。 
52] 论 旨 属性 : 遭受 性 主事 Th(P), 施 动 性 受 事 PCA)), 记 作 : 
V: (ThCP)，PCA) ) 。 
说 明 : “遭受 性 主事 ”和 ”“ 施 动 性 受 事 ”这 两 个 名 称 听 上 去 很 怪 ,其 
实 正 反 映 了 论 旨 角色 的 复杂 性 。 像 主事 theme, 有 人 干脆 就 翻译 成 
“客体 ”; 而 “ 施 动 性 受 事 ” 则 有 点 儿 像 是 作 格 Cergative case) 。 
53] 范畴 特性 : 均 为 名 词性 成 分 , 记 作 : Th(CP)，P(CA) 一 NP。 
[43 句法 特性 : 遭受 性 主事 ThCP) 实 现 为 主语 ; 施 动 性 受 事 ' 了 
CA) 实现 为 宾语 ,并 且 强 制 性 地 需要 有 数量 词 修 饰 。 记 作 : Th(P) 
一 Sub;P(A) 一 Obj。 
[5] 语义 特性 : Th(P) -> NPL 十 Human],P(CA) 一 NPE 十 Ani- 
mal，Winged] 。 
56] 句法 配置 飞 ” 及 其 论 元 能 构成 下 列 名 式 : 
S1: THE(B 斗 ECA》 
57] 典型 句 式 : 
S1: 老 王 一 了 一 只 镶 子 
C8] 真实 例句 :〈 略 ) 


9. 吃 : chi, (动词 ) 吃 别人 的 东西 , 即 从 别人 那儿 吃 东西 

[1 论 元 属性 : 三 元 (三 位 三 项 三 联 ) 动 词 , 记 作 : Vi; 3 (一 3 一 
3 一 3) ;或 称 : 三 元 三 系 动词 , 记 作 : V: 3 一 3, 或 V 。 

52] 论 旨 属性 :《 施 事 A, 受 事 P, 与 事 D), 记 作 : V: (A，P， 
站 六 

[3] 范畴 特性 : 均 为 名 词性 成 分 , 记 作 : A,，P,，D 一 NP。 

[4] 句法 特性 : 在 基础 句 中 , 施 事 A 实现 为 主语 , 受 事 P 实现 为 
直接 宾语 ,与 事 D 实现 为 间接 宾语 。 一 般 来 说 , 受 事 名 词 前 必须 有 
数量 词 作 修饰 语 。 记 作 : A ~ Sub;P ~ Obj2;D ~ Objl。 值 得 注 
意 的 是 ,与 事 D 可 以 通过 附加 方位 词 “ 那 儿 ? 而 转化 为 来 源 处 所 工 
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〈G)。 例 如 : "我 吃 了 小 王 一 个 苹果 一 我 从 小 王 那儿 吃 了 一 个 蔷 
果 ” 

[5] 语义 特性 : A,，D 一 NPL 十 Human]j,P -一 NPL 十 Foody/ 
fruit], 如 “ 锰 头 、 革 果 ” 等 。 

[6] 句法 配置 :“ 吃 ”及 其 论 元 能 构成 下 列 句 式 : 


S1: A 十 十 D 二 P 
S2: A 十 从 D 那儿 十 “十 P 


C7] 典型 句 式 : 


S]1: 我 ~ 了 小 张 一 个 革 果 
S2: 我 从 小 张 那儿 一 了 一 个 苹果 


C8] 真实 例句 :〈 略 ) 


10. 专政 : zhuGnzheng,〈 名 词 ? 统 治 阶级 对 敌对 势力 实行 的 强 
力 统治 

[1 论 元 属性 : 二 元 名 词 , 记 作 : N: 2, 或 Nz。 

[2] 论 旨 属性 : 《降级 施 事 dgA， 降 级 受 事 dgP), 记 作 : V: 
{dgA，dgP) 。 

说 明 : dg 是 降级 述 谓 结构 (down graded predication) 的 缩写 。 

[3] 范畴 特性 : 降级 施 事 dgA, 降 级 受 事 dgP 为 名 词性 成 分 , 记 
作 : dgA，dgP 一 NP。 

[4] 句法 特性 : 在 基础 句 中 ,二 元 名 词 “ 专 政 ” 作 形式 动词 “ 作 、 
进行 .实行 ?等 的 宾语 。“ 专 政 ?” 的 降级 施 事 dgA 跟 * 实 行 等 形式 动 
词 的 施 事 共 价 , 记 作 A(=dgA) ,实现 为 主语 ;专政 ”的 降级 受 事 
dgP 实现 为 状语 中 介词 “对 ?的 宾语 ,同时 作 * 实 行 专政 "这 个 动词 性 
结构 的 与 事 , 记 作 D(=dgP)。 上 面 的 叙述 ,可 以 记 作 : A(=dgA) 
一 Sub; 人 一 Obj;D( 王 dgP) 一 Prep 十 Obj。 另 外 ,把 这 种 基础 句 
“A(=dgA) 十 对 D( 王 dgP) 十 实行 十 专政 ”中 的 形式 动词 “实行 > 换 
成 名 词 化 标记 “的 ,就 变 成 名 词 化 的 偏 正 词组 “A(=dgA) 十 对 D(== 
dgP) 十 的 十 专政 ”。 

[5] 语义 特性 : A, P 一 NPL 十 Human]。 
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[56] 句法 配置 :专政 "及 其 论 元 能 构成 下 列 句 式 : 
S1: A(=dgA) 十 对 D( 一 dgP) 十 实行 十 _ 
S2: A(=dgA) 十 对 D( 一 dgP) 十 的 十 一 
[57] 典型 句 式 : 


S1: 无 产 阶 级 对 资产 阶级 实行 一 
S2: 无 产 阶 级 对 资产 阶级 的 一 


[58] 真实 例句 :《〈 略 ) 
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论 元 结构 和 句 式 结构 
互动 的 动因 、 机 制 和 条 件 


一 一 表达 精细 化 对 动词 配 价 和 名 式 构造 的 影响 


本 文 首 先 讨论 动词 配 价 学 说 、 论 元 结构 理论 和 和 句 式 语法 的 有 关 理 论 
和 观念 ,比较 它们 对 于 动词 和 名 式 的 关系 的 不 同 认识 以 及 相应 的 处 理 方 
法 。 接 着 ,指出 表达 的 精细 化 等 语 用 动机 促 动 了 句 式 套用 和 词 项 代入 ,这 
又 引发 了 动词 和 句 式 的 互动 ,其 结果 是 动词 改变 其 论 元 结构 来 适应 句 式 
意义 和 句 式 构造 的 需要 。 然 后 ,指出 名 式 套用 和 词 项 代入 的 认 知 基础 是 
隐喻 投射 和 完 形 包 装 , 强 调 以 归纳 动词 的 句法 组 配 模式 为 远 辑 起 点 ,可 以 
超越 动词 配 价 和 名 式 构 造 之 间 的 循环 论证 。 特 别 强调 与 事 插 入 、 施 事 删 
除 等 规则 是 动词 和 句 式 互动 的 具体 机 制 , 在 一 定 的 名 法、 语义 条 件 下 启动 
这 些 规 则 就 可 以 使 动词 衍生 出 符合 多 式 要 求 的 论 元 结构 。 最 后 ,说 明 动 
- 词 和 句 式 的 对 应 关系 是 有 理据 的 、 但 又 是 不 可 预测 的 ,动词 和 句 式 互 动 背 
后 的 逻辑 机 制 是 追求 动因 解释 的 归 因 推理 。 


1 如 何 解释 论 元 增 容 : 
从 动词 配 价 走 向 名 式 配 价 


1.1 动词 配 价 学 说 和 论 元 结构 理论 


朱德 如 (1978) 关 于 汉语 动词 “向 ”的 研究 ,直接 开启 了 上 个 世纪 
八 十 年 代 至 今 二 十 多 年 的 汉语 动词 配 价 (valence) 研 究 的 热潮 。 期 
间 ,我 们 的 动词 配 价 研究 不 仅 接受 了 德国 和 法 国 配 价 语法 和 依存 语 
法 的 有 关 理 论 和 方法 ,而 且 吸 收 了 在 生成 语法 背景 上 提出 的 格 语法 、 
论 元 结构 理论 等 的 有 关 观 念 和 分 析 技术 .中 动词 配 价 研究 的 主要 目 
的 是 : 通过 刻画 动词 和 相关 的 名 词性 成 分 之 间 的 支配 关系 及 其 句法 


@ 详 见 袁 久 林 (1998) ,第 48 一 98 页 。 
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配 列 (syntactic arrangement) ,来 解释 句法 结构 的 合格 性 .并 说 明 句 
法 结构 跟 语义 结构 之 间 的 映射 关系 .9 例如 : 
(1) a. 国家 主席 江泽民 会 见 了 美国 总 统 克 林 顿 
bx 国家 主席 江泽民 会 面 了 美国 总 统 克林顿 
(2) a. 国家 主席 江泽民 跟 美 国 总 统 克 林 上 顿 在 雅加达 会 面 
b. * 国家 主席 江泽民 跟 美 国 总 统 克 林 顿 在 雅加达 会 见 
由 于 二 价 动词 “会 见 ”" 可 以 支配 施 事 和 受 事 两 个 论 元 ,并 且 受 事 论 元 
只 能 实现 为 宾语 ,因而 (2b) 是 不 合格 的 表达 ;由 于 准 二 价 动词 “会 
面 > 可 以 支配 施 事 和 与 事 两 个 论 元 ,并 且 与 事 论 元 只 能 实现 为 介词 宾 
语 、 不 能 实现 为 宾语 ;因而 (lb) 是 不 合格 的 表达 。 
可 见 , 汉 语 动词 配 价 研究 奉行 的 是 动词 中 心 论 ,其 核心 的 思想 有 
两 点 : 
(i) 动词 决定 多 少 种 和 什么 样 的 从 属 成 分 (或 称 补 足 语 ) 跟 
它 共 现 ， 
(ii) 动词 具有 了 元 关系 ,等 待 着 一 定数 目 和 类 型 的 论 元 来 
填充 。 
这 论 元 数目 就 是 价 数 , 这 论 元 的 类 型 主要 指 论 旨 角色 ( 即 语义 角色 ， 
或 语义 格 , 俗 称 价 类 ) 。 
这 种 观念 正好 顺应 了 美国 语法 学 研究 中 的 词汇 主义 (lexical- 
ism) 思 潮 。 采 取 词 汇 主义 这 种 研究 路 子 的 学 者 相信 :@ 


(i) 动词 的 意义 跟 和 句法 框架 相关 ,动词 的 句法 范畴 框架 
CN 二 V 十 N…) 可 以 从 动词 的 词汇 语义 上 预测 。 也 就 是 说 ,句法 
是 词 项 要 求 的 实现 (投射 ) ,句法 框架 是 动词 意义 的 表层 反映 。 
比如 ,Jackendoff 等 把 这 种 思想 提炼 为 动词 组 合 的 透明 规则 : 
动词 的 意义 就 是 一 个 谓词 带 着 一 组 国定 的 论 元 ,并 造成 一 个 命 
题 。 


@ 详 见 袁 毓 林 (1998) ,第 87.96 页 。 
加” 详 见 Goldberg (1995) ,p. 7 一 19;Levin & Rappaport (1997) yp. 487 一 489。 
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(ii) 从 语义 角色 或 论 间 阵列 上 预测 显 性 的 名 法， 比如 ， 
Levin(1985) 认 为 : 普遍 的 连接 规则 (linking rule) 把 语义 的 论 
元 结构 映射 为 显 性 的 补足 语 结构 。 


这 种 思想 的 集中 体现 就 是 所 谓 的 论 元 结构 理论 ,其 中 ,Jackendoff 
《1972: 43) 提 出 了 著名 的 论 旨 阶层 (thematic hierarchy) ,意思 是 不 
同 的 论 旨 角 色 是 按照 阶层 的 形式 排列 的 。 可 以 表示 为 (当然 ,不 同 的 
学 者 对 论 旨 阶 层 上 不 同 论 旨 的 先后 次 序 有 不 同 的 认识 ) : 


施 事 > 处 所 /终点 /起 点 之 客体 
Larson 〈1988: 382) 提 出 了 著名 的 论 旨 指派 原则 ; 


如 果 一 个 动词 a 决定 若干 个 论 旨 角色 0，0 ，…，0. ,那么 将 
论 旨 阶层 上 最 低 的 那个 论 旨 角色 指派 给 句子 成 分 结构 (constit- 
uent structure) 中 位置 最 低 的 那个 论 元 ;然后 ,依次 类 推 地 指派 
其 余 的 论 旨 角色 。 


这 样 , 论 旨 阶 层 跟 深层 结构 上 的 成 分 结构 就 是 二 种 直接 的 映射 (di- 
rect mapping) ;凡是 表层 结构 中 论 元 位 置 跟 预 先 设计 好 的 论 旨 关 系 
次 序 不 对 应 ,就 必须 用 句法 上 的 移 位 来 处 理 .@ 比如 ,在 词 库 中 给 出 
动词 put 的 论 旨 关系 和 次 范畴 属性 两 种 描述 ,那么 就 很 容易 推导 出 
由 put 构成 的 句子 :@ 


〈3) a， zz 大 (Agent (Theme (Location) )》 
b. zxut,VLNP(CAgent)[ ,NPCThemey, PP(Loc 
tion) ]] 
c. John put the book on the table: 


这 种 词汇 主义 的 研究 路 线 ,符合 弗 雷 格 (Frege) 提 出 的 意义 的 组 
合 性 (compositionality) 原 理 : 一 个 语言 中 的 每 二 个 表达 式 的 意义 是 
其 直接 构成 成 分 的 意义 和 用 以 联结 这 些 成 分 的 句法 规则 的 函 项 
(function) 。 这 样 ,如 果 把 动词 的 配 价 性 质 搞 清楚 了 ,那么 句子 的 基 


@ 中 文 介绍 详 见 顾 阳 (1994) ,第 4 一 5 页。 
@ 下 面 的 举例 是 根据 顾 阳 (1996: 4) 改 编 的 。 
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本 构造 和 语义 解释 也 就 基本 抓 住 了 。 也 正 因为 如 此 ,汉语 动词 配 价 
研究 曾经 并 仍然 得 到 中 文 信息 处 理 专 家 的 青睐 。 


1.2 动词 变价 和 论 元 增 容 过 程 . 


动词 配 价 分 析 在 方法 论 上 是 属于 自 底 向 上 式 的 (bottom-up) 还 
原 主义 (reductionism) 。 这 种 分 析 方 法 虽然 简捷 明快 ,但 是 它 并 不 总 
是 奏效 的 ;最 突出 的 一 点 是 : 它 不 能 很 好 地 解释 从 动词 的 语义 和 配 
价 上 无 法 预测 的 句 式 构造 。 例 如 :9 


(1) a. 考 王 扔 我 一 包 烟 。 
b. 他 吃 了 我 一 个 苹果 。 
(2) a.。 他 烂 了 几 个 橘子 。 
b. 他 坐 了 一 屁股 泥巴 。 
(3) a。 他 弄 了 一 手 油污 。 
b. 他 和 急 了 一 身 汗 。 
c. 这 事 急 了 他 一 身 汗 。 


例 (1) 中 的 二 价 动词 “ 扔 、 吃 2? 带 了 施 事 (agent, 简称 A)、 受 事 (pa- 
tient, 简 称 P) 和 与 事 (dative, 简称 D) 三 个 论 元 ,这 与 事 论 元 本 来 不 
是 这 两 个 动词 的 语义 所 蕴涵 的 语义 角色 ; 例 (2) 和 例 (3b) 中 的 一 价 
动词 或 形容 词 “ 伴 、 坐 、 急 ” 带 了 当 事 (experiencer) 和 客体 (theme) 或 
结果 (resultive) 两 个 论 元 ,同样 这 客体 或 结果 论 元 本 来 不 是 这 三 个 
动词 (包括 形容 词 ) 的 语义 所 荀 涵 的 语义 角色 。 本 来 二 价 动词 “ 摸 "可 
以 带 施 事 和 受 事 两 个 论 元 ,但 是 在 例 (3a) 中 它 带 了 施 事 和 结果 两 个 
论 元 ,同样 这 结果 论 元 本 来 不 是 动词 “ 摸 ” 的 语义 所 荀 涵 的 语义 角色 。 
在 例 (3c) 中 ,一 价 动词 “ 急 居 然 带 了 致 事 (causer)、 受 事 和 结果 三 个 
论 元 ,显然 , 受 事 和 结果 两 个 论 元 本 来 不 是 “ 急 ” 的 语义 所 列 涵 的 语义 
角色 。 

对 此 ,着 眼 于 动词 配 价 的 学 者 的 自然 的 反应 是 : 仍然 把 这 种 名 
法 现象 归结 为 动词 本 身 , 常 规 的 做 法 是 把 它 处 理 为 由 于 词义 变化 带 


@ 例子 和 说 明 参 考 沈 家 灶 (2000) ,第 291 页 。 


论 元 结构 和 句 式 结构 互动 的 动因 、 机 制 和 条 件 193 


来 的 配 价 变化 。 比 如 , 马 庆 株 (1983: 107) 认 为 : 在 “ 扔 我 一 个 球 ” 一 
类 句子 中 ，“ 扔 ?类 动词 本 身 没 有 给 予 意义 ,经 常用 作 二 价 动词 ;只 是 
在 双 宾 语 构造 里 才 具 有 给 予 意义 ,成 为 三 价 动词 。 马 庆 株 (1998) 进 
一 步 指 出 , 价 数 固定 的 动词 是 定价 动词 , 价 数 不 固 定 的 动词 是 变价 动 
词 ; 价 数 受 义 项 的 影响 ,如 "“ 吃 、 扔 ”一 般 表 现 为 二 价 ,在 一 定 条 件 下 
〈 双 宾 构 造 中 ) 又 会 表现 为 三 价 (第 286 页 ); 配 价 成 分 数量 的 变化 是 
这 种 变价 动词 的 形式 标志 (第 284 页 ) 。 

这 种 所 谓 的 动词 变价 现象 ,在 英语 中 也 是 屡见不鲜 的 。 例 如 : 


(4) a。 Sally baked her sister a cake. 
b. Joe painted Sally a picture. 
c。 Joe cleared Sam a place on the floor. 
(5) a，Pat threw Chris the ball; 
b.，Chris kicked Pat the ball. 
c.。 了 Pat hit Chris the ball. 
《6) a、Dan talked himself blue in the face. 
b. Sam carefully broke the eggs into the bowl. 
c。He sneezed the napkin off the table. 


例 (4) 中 的 bake、paint clear 和 例 (5) 中 的 threw kicked hit 是 二 价 
动词 ,只 能 带 施 事 和 受 事 两 个 论 元 ,这 里 却 多 带 了 一 个 与 事 论 元 。 例 
《6a) 中 的 talk 是 一 价 动词 ,只 能 带 施 事 一 个 论 元 ,这 里 却 多 带 了 一 
个 受 事 论 元 和 一 个 结果 论 元 ; 例 (6b) 中 的 break 是 二 价 动词 ,只 能 带 
施 事 和 受 事 两 个 论 元 ,这 里 却 多 带 了 一 个 处 所 论 元 ; 例 (6c) 中 的 
sneeze 是 一 价 动词 ,只 能 带 施 事 一 个 论 元 ,这 里 却 多 带 了 一 个 受 事 论 
元 和 一 个 处 所 论 元 。 

对 此 ,Larson (1990) 认为 ,上 例 中 的 bake、hit 等 动词 经 历 了 
一 个 词汇 派生 (derivation) 过 程 , 这 个 过 程 被 称 作 论 元 增 容 Cargu- 
ment augmentation), 它 可 以 在 一 定 的 条 件 于 给 动词 的 论 元 结构 增 
加 新 的 论 元 。 比 如 ,英语 及 物 动 词 的 论 元 结构 增加 受益 者 (bene- 


OO 例 (4) 一 (6) 引 自 Goldberg (1995),p.9,，21，22，34,，35,， 141，143。 
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factive) 和 目标 (goalD) 论 元 的 词汇 规则 (lexical rule) 可 以 具体 地 表示 
如 下 : 
(7) 增加 受益 者 (可 选 ): 向 动词 & 的 论 旨 网 格 (6-giid) 中 增 
加 受益 者 论 旨 角色 。 
条 件 : 动词 w 表示 制作 (creation) 或 准备 (preparation) 事件 
(Cevent) 。 
结果 : 客体 为 受益 者 提供 了 利益 。 
(8) 增加 目标 (可 选 ): 向 动词 w 的 论 时 网 格 中 增加 目标 论 
旨 角 色 。 
条 件 : 动词 表示 运动 (motion) 事 件 , 其 中 施 事 向 客体 发 
出 一 个 射 体 轨道 。 


可 见 , 论 元 增 容 是 受 词汇 和 语义 条 件 限 制 的。 比如 ,增加 受益 者 要 求 
动词 表示 制作 或 准备 意义 ,动词 所 支配 的 客体 所 表示 的 必须 是 成 事 
宾语 ,这 种 宾语 是 通过 动词 所 描述 的 事件 创造 出 来 的 , 它 可 以 使 新 增 
加 的 受 惠 者 论 元 得 益 。 根 据 词 汇 规则 (7) 和 (8)，, 可 以 把 动词 bake、 
hit 的 论 元 增 容 过 程 表 示 如 下 :9 


(9) abake: {0 施 事 者 ,6 客体 } 
论 元 增 容 St 受 惠 者 ) 
b. bake: ee 受 惠 者 } 
(10) ahit: (60 施 事 者 ,0 客体 ) 
论 元 增 容 Re” 目标 ) 
b。 hit: 《0 二 目标 ) 


(9a)(10a) 是 bake、hit 固有 的 论 元 结构 , (9b) (10b) 是 论 元 增 容 后 


@ 详 见 Larson (1990) ，p. 615 一 618; 顾 阳 (1999) 作 了 很 好 的 介绍 ,并 作 了 一 定 的 引 
申 和 发 挥 , 第 81 一 82 页 。 


论 元 结构 和 句 式 结构 互动 的 动因 、 机 制 和 条 件 195 


bake、\hit 的 论 元 结构 。(10b) 新 增加 的 受 惠 者 论 元 可 以 用 介词 for 
引导 ,从 而 投射 成 与 格 结构 (如 : Mary baked a cake for John. ) 。 因 
为 介词 for 本 身 含 有 受 惠 义 , 跟 新 增加 的 受 惠 者 论 元 意义 相 重 ;所 以 
这 种 与 格 结构 可 以 经 过 被 动 化 处 理 ， 2 
Mary baked John a cake. ) 。 

这 种 做 法 的 实质 就 是 碰 到 新 的 用 法 就 给 动词 增加 意义 ,但 是 , 调 
用 (7)(8) 这 种 可 选 性 的 词汇 规则 的 动因 和 条 件 并 不 明确 。 如 果 这 种 
变价 动词 为 数 不 多 ,那么 或 许可 以 把 这 种 变价 用 法 归结 为 是 这 少数 
动词 的 词汇 特异 性 (lexical idiosyncrasy) 。 可 事实 是 ,这 种 变价 用 法 
是 比较 普遍 的 ,不 仅 二 价 动词 在 特定 句 式 中 可 以 带 三 个 论 元 ,而 且 二 
价 动词 在 特定 句 式 中 也 可 以 带 三 个 论 元 。 这 就 需要 一 种 更 有 概括 性 
和 解释 力 的 理论 模型 来 处 理 这 类 现象 。 


1.3 句 式 语法 和 句 式 配 价 


在 Fillmore、Kay\、O”Connor、Lakoff、 Brugman、Lambrecht、 
Langacker 等 学 者 关于 句 式 (constructions) 的 工作 的 影响 下 ,Gold- 
berg〈1995) 提 出 了 系统 的 名 式 语 法 (constzuction Giamrmiat) 的 思想 
和 分 析 方法 。 这 种 句 式 路 线 (constructional appioachy 在 未 质 上 是 
反对 词汇 路 线 (lexical approach) 的 ,其 中 心 观点 是 : 英语 的 基础 名 
\basic sentences) 是 句 式 的 实例 (instances)， 句 式 是 一 种 “形式 二 意 
义 ? 配 对 , 它 独 立 存在 于 特定 的 动词 。 即 句 式 自己 负载 意义 ; 狐 立 于 
句 中 词 项 的 意义 ;也 就 是 说 ,句子 的 语义 结构 及 其 形式 表达 是 由 独立 
于 其 构成 词 项 的 句 式 造成 的 (p. 1)。 这 跟 Chomsky (1981,，19927 
等 认为 句法 构造 (syntactic constructions) 是 由 普遍 原则 的 互动 作用 
而 造成 的 附带 现象 (epiphenomenal) 的 观点 通 然 不 同 。 这 样 ,上 上 文 讨 
论 的 动词 变价 和 论 元 增 容 就 不 必 归 结 为 同一 个 动词 有 几 种 不 同 的 意 
义 Csense) ,而 是 可 以 非常 节俭 地 把 同一 动词 在 不 同 句 式 中 的 意义 差 
别 归 结 为 特定 的 句 式 。 

Goldberg (1995) 对 句 式 下 的 定义 是 : 如 果 一 个 “形式 一 意义 ” 配 
对 (form-meaning correspondences) 的 形式 或 意义 方 面 的 特性 不 能 
从 其 构成 成 分 或 其 他 句 式 上 推导 出 来 ,那么 它 就 是 一 个 句 式 (p. 4) 。 


196 基于 认 知 的 汉语 计算 语言 学 研究 


并 且 认 为 ,简单 的 小 句 结构 跟 反 映 人 类 基本 经 验 的 语义 结构 直接 相 
关 , 句 式 所 涉及 的 基本 的 论 元 结构 是 跟 动 态 的 场景 (有 经 验 基础 的 格 
式 塔 ) 相 关 的 (p. 5) 。 从 而 构建 了 一 种 解释 性 的 、\ 而 不 是 生成 性 的 单 
层次 的 (monostratal) 语 法 理论 。 在 怎样 看 待 动词 和 句子 的 论 元 结 
构 关 系 上 ,这 种 句 式 路 线 跟 词汇 路 线 最 大 的 不 同 点 是 , 它 强 调动 词 跟 
句 式 相 关 但 各 自 独 立 , 框 式 结构 (skeletal constructions) 可 以 提供 论 
元 ,比如 双 宾 语 结构 (double object constructions) 可 以 允 准 与 事 论 
元 。 于 是 ,二 价 的 bake、cook 等 制作 (create) 动 词 可 以 进入 双 宾 语 结 
构 。 这 样 , 句 子 中 论 元 成 分 之 间 的 mn 元 关系 直接 跟 框 式 结构 相 联系 ， 
动词 只 跟 少 量 的 基础 义 项 相 联系 ,这 些 意义 一 定 能 整合 进 句 式 意义 
中 (p.11) 。 当 一 个 动词 出 现在 不 同 的 句 式 中 时 整个 句 式 的 意义 及 
限制 是 不 同 的 。 这 种 不 同 不 必 归 结 为 动词 的 不 同 义 项 ,可 以 更 节俭 
地 归结 为 这 些 不 同 的 句 式 本 身 (p. 13) 。 由 于 句法 框架 直接 跟 意 义 相 
联系 ,并 且 独 立 于 出 现 于 其 中 的 动词 (p. 19) ;因而 关于 语义 的 组 合 性 
原理 可 以 表达 成 如 下 这 种 弱 形 式 : 一 个 表达 式 的 意义 是 构成 词 项 的 
意义 和 句 式 意义 的 整合 (p. 16) 。 

在 这 种 句 式 语 法 思想 的 影响 下 , 沈 家 迷 (2000) 毅 然 地 把 配 价 看 
作 是 句 式 的 属性 ;并 指出 : 句 式 配 价 指 抽象 的 句 式 配备 的 、 与 谓语 动 
词 同 现 的 名 词性 成 分 的 数目 和 类 属 ( 指 施 事 、 受 事 、. 与 事 \ 工 具 等 )。 
这 样 ,他 扔 我 一 个 球 ” 属 于 三 价 句 式 , 跟 “ 我 送 他 一 本 书 ” 一 样 有 施 
事 、 受 事 和 与 事 三 个 论 元 ,尽管 “ 扔 ”的 词义 只 涉及 两 个 参与 角色 
Cparticipant role)3%( 她 结婚 ) 你 送 什么 ?属于 三 价 句 式 ,包含 施 事 和 
受 事 两 个 论 元 ,尽管 “ 送 ” 的 词义 涉及 施 事 、 受 事 和 与 事 三 个 参与 角 
色 。 同 样 ,“ 王 冕 死 了 父亲 ”属于 二 价 名 式 , 跟 * 他 丢 了 一 枚 戒指 "一样 
包含 两 个 论 元 ,尽管 “ 死 2 的 词义 只 涉及 一 个 参与 角色 (第 293 一 4 
页 ) 。 用 这 种 思想 来 解释 81. 2 中 的 例 (1) 一 (6) 这 类 论 元 增 容 的 句 
子 ; 倒 不 失 为 一 种 简捷 的 办 法 。 问 题 是 ,这 种 句 式 的 配 价 能 力 是 由 什 
么 决定 的 呢 ? 沈 先 生 的 回答 是 , 句 式 的 配 价 或 论 元 主要 是 由 句 式 的 
整体 意义 所 决定 的 ,“ 王 冕 死 了 父亲 ”所 属 的 句 式 的 整体 意义 要 求 这 
个 句 式 有 两 个 论 元 ,“ 王 冕 的 父亲 死 了 ?所属 的 句 式 的 整体 意义 只 要 
求 这 个 句 式 有 一 个 论 元 (第 294 页 )。 我 们 认为 ,问题 没有 这 么 简单 
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和 轻松 。 因 为 , 接 下 来 的 问题 该 是 : (1) 句 式 的 整体 意义 是 由 什么 
决定 的 ? 〈2) 句 式 对 进入 其 中 的 动词 的 选择 限制 条 件 是 什么 ?如 果 
不 能 很 好 地 解决 这 两 个 问题 ,那么 句 式 语法 和 句 式 配 价 路 线 就 不 会 
比 词汇 语法 和 动词 配 价 路 线 高 明 多 少 。 充 其 量 也 只 是 把 动词 变价 和 
论 元 增 容 的 球 踢 到 了 句 式 这 个 楼 上 (kick upstairs) 。 


2 表达 精细 化 和 句 式 套用 、 词 项 代 人 


2.1 句 式 意义 从 何 而 来 ? 


沈 家 迷 (2000) 强 调 , 句 式 的 配 价 或 论 元 主要 是 由 名 式 的 整体 意 
义 所 决定 的 (第 294 页 )。 这 也 许 是 不 错 的 , 比如 ,表示 转让 (trans- 
fer) 意 义 的 句 式 要 求 施 事 、 受 事 和 与 事 三 个 论 元 , 而 不 管 进 入 其 中 的 
动词 是 二 价 的 还 是 三 价 的 ;表示 丧失 (lose) 意义 的 句 式 要 求 当 事 
(Cexperiencer, 简称 下 ) 和 客体 (theme, 简称 Th) 两 个 论 元 ,而 不 管 进 
和 人 其 中 的 动词 是 二 价 的 还 是 三 价 的 。 例 如 : 


(1) NP (A) 十 V 十 NP (D) 十 NP (P) 
a. 老 张 送 小 王 一 本 词典 
b. 老 刘 卖 小 孙 一 支 钢 笔 
c. 小 平 捞 奶奶 一 块 鱼 排 
d. 小 明 扔 小 华 一 个 好 球 
e. 老 张 抢 小 王 一 本 词典 
所 老 刘 买 小 孙 一 支 钢笔 
g. 小 平 吃 奶奶 一 块 重 排 
h. 小 明 用 小 华 一 张 宣 纸 
(2) NP CE) 十 V 十 NP (Tb) 
a.。 王 时 [七 岁 时 ] 失去 了 父亲 
罗 攻 光 开本 录 了 3 交 亲 
.。 王 大 和 丢 了 一 串 钥匙 
-. 王 大 区 掉 了 一 串 钥匙 
中 入 厌 芝 : 沽 定 全 只 他 子 


OO = [加 
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fi 王 大 务 飞 了 一 只 久子 
g. 我 家 损失 了 一 复 苹 果 
h. 我 家 烂 了 一 篮 苹 果 

i. 我 家 报废 了 一 台电 视 
j. 我 家 被 偷 了 一 台电 视 


例 (1) 中 的 “ 送 、 卖 、 抢 、 买 ?是 三 价 动词 ,而 “ 接 、 扔 、 吃 ,用 ?是 二 价 动 
词 ; 但 是 ,三 价 句 式 ^NP (A) 十 V 十 NP (D) 十 NP(P)” 使 得 它们 都 能 
跟 三 个 论 元 发 生 句 法 .语义 关系 。 至 于 为 什么 这 种 句 式 是 三 价 的 , 显 
然 不 能 归结 为 其 中 的 谓语 动词 (因为 ,其 中 既 有 三 价 动词 ` 也 有 二 价 
动词 ) ,而 是 要 归结 到 这 种 句 式 所 具有 的 转让 意义 一 一 转让 关系 要 涉 
及 到 转让 物 ( 即 受 事 )、 让 出 者 ( 即 施 事 ) 和 接受 者 ( 即 与 事 )。 例 (2) 中 
的 “失去 、 丢 、 损 失 ” 是 二 价 动词 ,而 “ 死 、. 掉 `. 飞 . 烂 、 报 废 ? 是 一 价 动词 
但 是 ,二 价 句 式 *NP (E) 十 V 二 NP (Th)” 使 得 它们 都 能 跟 两 个 论 元 
发 生 句法 .语义 关系 。 至 于 为 什么 这 种 句 式 是 二 价 的 ,显然 不 能 归结 
为 其 中 的 谓语 动词 (因为 ,其 中 既 有 二 价 动词 ` 也 有 一 价 动词 ), 而 是 
要 归结 到 这 种 句 式 所 具有 的 丧失 意义 一 一 丧失 关系 要 涉及 到 丧失 物 
( 即 客体 ) 和 受害 者 ( 即 当 事 ) 。 

现在 的 问题 是 , 句 式 “<NP (A) 十 V 十 NP (D) 十 NP (P)” 的 转让 
意义 是 从 哪儿 来 的 , 句 式 “NP (E) 十 V 十 NP (Th)” 的 丧失 意义 是 从 
哪儿 来 的 ? 显然 ,词类 (形式 类 ) 序 列 “NP+VTNP 二 NP2” 和 ”“NP 十 
V 十 NP” 本 身 是 不 可 能 产生 出 转让 和 丧失 之 类 的 句 式 意义 的 。 一 种 
最 有 可 能 的 答案 是 : 这 种 能 决定 句 式 配 价 的 句 式 意义 是 由 动词 的 论 
元 结构 提供 的 ,动词 的 论 元 结构 中 各 论 元 角色 之 间 的 语义 关系 的 抽 
象 化 为 有 关 句 式 提供 了 最 初 的 意义 。 例 如 : 

(3) a. 送 : { 送 者 , 送 物 , 受 者 } 

卖 : { 卖 者 , 卖 物 , 买 方 } 
抢 : { 抢 者 , 抢 物 , 被 抢 者 } 
买 : { 买 者 , 买 物 , 卖 方 }》 
V: { 施 事 , 受 事 , 与 事 } 


这 四 个 动词 的 词汇 意义 都 涉及 三 个 参与 角色 (participant role) ,如果 


8 已 PR 区 
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对 这 些 参与 角色 进行 概括 ,那么 送 者 、 卖 者 、. 抢 者 、 买 者 等 都 包含 施 动 
性 (causation), 因 而 可 以 抽象 为 施 事 ; 送 物 、 卖 物 、 抢 物 . 卖 者 都 包含 
受 动 性 (causally affected), 因而 可 以 抽象 为 受 事 ; 受 者 、 有 买方、 被 抢 
者 .卖方 等 都 包含 参与 性 (participant in), 因而 可 以 抽象 为 与 事 。 
“ 送 、 卖 ?等 表达 的 是 受 事 从 施 事 方 转移 到 与 事 方 , 可 以 概括 为 给 予 ; 
因此 , 当 它们 跟 受 其 支配 的 论 元 实现 为 “NP 十 V 十 NP 十 NP” 之 类 的 
句法 形式 时 ,这 种 句 式 自然 地 具有 给 予 这 种 句 式 意义 。“ 抢 . 买 ” 等 表 
达 的 是 受 事 从 与 事 方 转 移 到 施 事 方 ,可 以 概括 为 取得 ;因此 , 当 它 们 
跟 受 其 支配 的 论 元 实现 为 “NP 十 V 十 NP 十 NP” 之 类 的 句法 形式 时 ， 
这 种 句 式 自然 地 具有 “取得 ?这 种 句 式 意义 。 给 予 和 取得 都 涉及 受 事 
在 施 事 方 和 与 事 方 之 间 转 移 , 只 是 方向 相反 ;因此 ,可 以 进一步 概括 
为 转让 。 和 于 是 , 句 式 *NP (A) 十 V+NP(D) 十 NP (P)” 自 然 地 从 其 
核心 动词 的 论 元 结构 上 获得 了 “转让 ”这 种 名 式 意义 。 


2.2， 句 式 套用 和 词 项 代入 


一 方面 ,由 于 句 式 意义 是 由 动词 的 论 元 结构 带 来 的 ,因而 表示 不 
同意 义 的 名 式 对 进入 其 中 的 动词 在 语义 上 有 严格 的 选择 限制 。 比 
如 ”“NP CA) 十 V 二 NP (D) 十 NP (P)” 句 式 要 求 其 中 的 动词 必须 是 
表示 给 予 或 取得 等 转移 意义 的 ,“NP (E) 十 V+NP (Th)” 和 句 式 要 求 
其 中 的 动词 必须 是 表示 形 失 意义 的 。 但 是 , 另 一 方面 ,典型 动词 的 论 
元 结构 被 结构 (或 句法 型 式 ,syntactic configuration) 包 装 之 后 ,这 个 
结构 (或 称 句 式 ) 也 就 获得 了 原型 的 格式 意义 ;并 且 , 句 式 作为 一 种 形 
式 和 意义 的 配对 ,具有 相当 的 模 塑 性 , 它 能 把 那些 在 语义 上 跟 句 式 意 
义 不 同 、 但 是 又 不 相抵 触 的 动词 吸收 进来 。 例 如 

G) NP CA) 十 V+TNP CD) 二 NP (P) 
a- 大 张 扔 小 刘 一 包 香 烟 < a'. 大 张 乡 小 刘 一 包 香 
烟 
b. 小 平 灌 李 伟 一 杯 和 白酒 < b'. 小 平 给 李 伟 一 杯 
白酒 
c- 小 明 吕 小 华 一 个 斜 线 球 < c . 小明 给 小 华 一 个 


200 基于 认 知 的 汉语 计算 语言 学 研究 


针线 球 

d. 玉 芳 妊 定 公公 一 条 香烟 < d'. 玉 芳 委 公 公 一 
条 香烟 

e. 李 铎 路 了 小 邵 一 个 苹果 < e'. 李 铎 掌 了 小 邵 一 
个 革 果 

f. 玲玲 只 穿 过 姥姥 一 件 毛衣 二 并. 玲玲 只 拿 过 姥 
姥 一 件 毛 衣 

g. 老 刘 响 了 小 孙 一 支 香 烟 二 h'. 老 刘 订 了 小 孙 
一 支 香 烟 

h. 小 芳 范 了 奶奶 一 百 块 钱 < g . 
一 百 块 钱 

i 小 明 业 电 了 我 好 几 张 宣纸 < 小 明 守 了 我 好 
几 张 宣纸 

j. 王 平 哩 了 区 区 一 千 块 钱 < 一 j . 王 
千 块 钱 


(2) NP CE) 十 V 十 NP (Th) 
a. 王 晃 死 了 父亲 <a. 
b. 王 大 爷 现 了 一 
钢 子 


了 一 台电 视 一。 我 家 轿 国 了 一 台电 


在 例 (1) 中 ， 扔 ” 指 把 东西 用 扔 的 方式 给 别人 “ 灌 ? 指 把 液体 倒 进 人 
嘴 里 ,它们 具有 上 比较 明显 的 给 予 性 转移 意义 ;所 以 ,可 以 套用 双 宾 语 
句 式 “NP (A) 十 V 二 NP (D) 十 NP (P)”, 来 表示 施 事 主动 地 使 受 事 
转移 到 与 事 方 。 跟 由 “ 送 、 给 ”等 典型 的 给 予 义 动词 构成 的 双 宾 语句 
在 句 式 意义 上 的 差别 是 : 这 种 双 宾 句 并 不 表示 受 事 原来 在 施 事 方 ， 
而 后 者 则 包含 受 事 原来 在 施 事 方 这 种 意义 。“ 踢 ?本 来 指 抬 起 腿 用 脚 
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撞击 ,在 用 踢 的 方法 传 球 的 场景 知识 (scenes knowledge) 的 影响 下 ， 
也 临时 含有 给 予 意义 天 孝敬 ” 指 把 物品 献 给 长 者 以 示 敬 意 , 本 来 就 包 
含 一 定 的 给 予 意 义 。 因 此 ,它们 可 以 套用 双 宾 语句 式 来 表示 给 予 性 
转移 意义 。“ 吃 (苹果 )”“ 穿 (毛衣 )” 本 来 是 消费 行为 ,但 是 当 消 费 的 
是 别人 的 东西 时 ,也 就 等 于 是 从 别人 那儿 (与 事 方 ) 得 到 了 这 种 消费 
品 。 因 此 ,可 以 套用 双 宾 语句 式 <NP (A) 十 V+NP (D) 十 NP (P)”， 
来 表示 施 事 从 与 事 方 取 得 某 种 消费 品 。 跟 由 “ 抢 、. 买 ”等 典型 的 取得 
义 动 词 构成 的 双 宾 语句 在 句 式 意 义 上 的 差别 是 : 这 种 双 宾 句 并 不 表 
示 施 事 的 取得 行为 一 定 是 主动 的 ( 即 可 以 是 主动 的 ,如 “ 吃 类 双 宾 语 
句 ;也 可 以 是 无 所 谓 主动 或 被 动 的 ,如 “ 穿 ? 类 双 宾 语句 ) ,而 后 者 则 表 
示 施 事 一 定 是 主动 地 实施 取得 这 种 行为 。“ 花 ( 钱 )”“ 抽 ( 烟 )”“ 粳 
踊 ” 本 来 指 耗 费 或 损坏 财物 并 蕴涵 失去 意义 ,但 是 当 施 事 者 耗费 或 损 
坏 别 人 的 财物 时 ,在 某 种 意义 上 说 是 从 别人 那儿 (与 事 方 ) 得 到 了 这 
种 财物 ( 受 事 );“ 坑 ? 指 用 狭 独 .狠毒 的 手段 使 人 受到 损害 ,这 在 某 种 
意义 上 讲 也 是 从 别人 那儿 与 事 方 ) 得 到 了 利益 (哪怕 只 是 精神 上 
的 )。 因 此 ,也 可 以 套用 双 宾 语句 式 ^NP (A) 十 V 二 NP (D) 十 NP 
〈P)”, 来 表示 施 事主 动 地 使 与 事 方 失去 财物 或 利益 .并 使 这 种 财物 
或 利益 转移 到 与 事 方 。 在 例 (2) 中 ,“( 亲 人 ) 死 ( 亡 ) (宠物 ) 飞 ( 走 )、 
〈 水 果 )( 腐 ) 烂 电器) 报废 ”, 这 对 于 个 人 和 家 庭 来 说 都 是 一 种 损失 ; 
因此 ,可 以 套用 表示 失去 意义 的 句 式 ^NP (E) 十 V 十 NP (Th)”, 来 
表示 当 事 失 去 了 客体 并 由 此 而 造成 了 损失 。 有 意思 的 是 ,我 们 在 ( 儒 
林 外 史 》 兴 上 海 古 籍 出 版 社 ,2000 年 ) 中 ,找到 了 类 似 (2a-a2) 这 种 平 
行 的 实例 ， 

(3) 这 人 姓 王 名 时 ，…… 七 岁 上 死 了 父亲 ，……。 。 交 第 1E 

《4) 这 虞 博士 三 岁 上 改 了 母亲 ,太公 在 人 家 教书 ，……. 

(第 36 回 ) 


“ 死 " 是 一 价 的 不 及 物 动 词 ,套用 了 二 价 的 及 物 动词 “ 丧 ” 的 用 法 。 特 
别 要 指出 的 是 ,在 古代 汉语 中 , 丧 ? 有 及 物 和 不 及 物 两 种 用 法 。 例 
如 :〈 引 自 《 古 汉语 常用 字 字典 》 第 246 页 ,商务 印 书馆 ,1993) 


(5)[ 徐 ] 候 王 行 仁义 而 囊 其 国 。( 韩 非 子 。 五 宫 ) 
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(6) 寻 程 把 妹 间 于 武昌 。( 陶 潜 ( 归 去 来 今 奸 序 》 寻 : 不 
灵 ) 


“ 丧 ” 作 及 物 动词 用 时 ,表示 “失去 ”意义 ,如 (5) 所 示 ; 作 不 及 物 动 词 用 
时 ,表示 “死亡 ”意义 ,如 (6) 所 示 。 绝 妙 的 是 ,在 例 (4) 中 ,这 两 种 意义 
好 像 是 兼 而 有 之 。 

值得 注意 的 是 ,对 于 例 (1)(2) ,一 方面 ,我 们 固然 可 以 说 是 : 扔 、 
吃 ? 类 动词 套用 了 “ 送 .给 ”类 动词 惯用 的 双 宾 语句 式 <NP〈A) 十 V 十 
NP (D) 十 NP (P)”,“ 死 \ 飞 ”类 动词 套用 了 “失去 、 损 失 ? 类 动词 惯用 
的 “NP(E) 十 V 十 NP〈Th)” 句 式 , 从 而 凸现 Cprofiling) 了 这 些 动词 
的 意义 中 隐藏 着 的 给 予 意义 。 但 是 , 另 一 方面 ,我 们 也 可 以 说 是 “ 扔 、 
吃 ? 类 动词 代 换 了 典型 的 “ 送 、 给 ”类 动词 .而 进入 双 宾 语句 式 NP 
(A) 十 V+TNP (D) 十 NP (P)”,“ 死 \ 飞 ”类 动词 代 换 了 典型 的 失去 、 
损失 ”类 动词 .而 进入 NP (〈E) 十 V 十 NP〈Th)? 句 式 。 也 就 是 说 ,在 
意义 上 更 为 具体 的 动词 代替 意义 相对 抽象 的 上 位 动词 ,具体 的 下 位 
动词 作为 抽象 的 上 位 动词 的 一 个 实例 (instance) 而 进入 本 来 由 上 位 
动词 主导 的 句 式 ,从 而 在 表示 给 予 / 取 得 性 转移 意义 的 同时 ,还 表示 
给 予 的 方式 扔 、 灌 、 踢 、 孝 敬 等 ,或 者 还 表示 取得 的 方式 吃 ` 穿 . 抽 、 花 、 
糟 踢 、 坑 等 ;在 表示 失去 意义 的 同时 ,还 表示 失去 的 方式 死亡 `\ 飞 翔 、 
腐烂 .报废 、 甚 至 是 被 盗 等 。 这 就 是 词汇 意义 和 句 式 意义 互动 的 一 个 
侧面 。 


2.3 动词 代入 的 语 用 动因 : 表达 的 精细 化 


根据 上 面 的 讨论 , 句 式 套 用 和 动词 代入 是 造成 动词 的 配 价 跟 句 
式 配 价 不 一 致 的 一 个 主要 的 原因 。 比 如 ,“ 扔 、 灌 、 踢 、 孝敬、 吃 、 穿 、 
抽 、 花 、 糟 踢 、 坑 ?等 二 价 动词 可 以 进入 三 价 的 双 宾 语句 式 “ 死 、 飞 、 
烂 .报废 ”等 一 价 动词 可 以 进入 二 价 句 式 。 如 果 动 词 的 配 价 跟 句 式 
的 配 价 不 一 致 ,那么 一 定 会 造成 动词 的 参与 角色 跟 句 式 的 论 元 在 数 
量 和 类 型 上 的 配合 不 适当 ,简称 角色 错 配 (role mismatches)。 例 如 : 


(1) 扔 :{ 折 者 ,[ 受 扔 者 ], 扔 物 } 如 : 大 张 正 一 手 焰 弹 呢 
} } } 


论 元 结构 和 句 式 结构 互动 的 动因 、 机 制 和 条 件 203 


A 十 V+D 十 了 P 如 :大 张 一 [给 ] 小 刘 一 包 
香烟 
《2) 踢 : { 吕 者 ,[ 接 受 者 ]， 踢 物 }) 如 : 这 头 牛 老 一 人 、 孩 子 
们 正 一 足球 呢 
y y y 
AT 二 TV+D 十 P 如 :小 王 一 [给 ] 我 一 个 
针线 球 
《3) 吃 : { 吃 者 ,[ 被 吃 者 ], 吃 物 ) 如 : 我 一 了 一 个 橘子 、 她 
TPR 对 
y y y 
A 十 V 十 D -二 一 如 二 我 一 了 小 王 一 全 糙 
子 
〈4) 寺 :《 坑 者 ,被 坑 者 ,[ 被 坛 物 ]) 如 : 这 个 鱼 贩子 老 一 新 
顾客 
+ + 
AT+VT+D ;十 “P = 如 : 这 个 骗子 一 了 我 一 
大 笔 保 证 金 
《5) 死 : 人 5 受 损 者 ] ,死者 ) 如 : 他 的 父亲 一 了 、 张 家 的 小 狗 
入 加 
y 
E 十 V 十 Th 如 : 他 一 了 父亲 、\ 张 家 一 了 一 只 
小 狗 
《6) 飞 : {[ 受 损 者 ], 飞 者 ) 如 : 他 的 镶 子 一 了 AS 老 张 的 小 岛 
< 汪 台 
y y 
E 十 V 十 Th 如 : 他 一 了 一 只 包子 、 老 张 一 了 
一 只 小 乌 
《7) 烂 : 代 受 损 者 ], 烂 物 ) 如 : 他 的 革 果 一 了 、 张 家 的 白菜 
全 一 了 
y y 
ET 十 V 十 Th 如 : 他 一 了 几 个 苹果 张 家 一 了 
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一 窗 白 菜 
(8) 报废 : {[ 受 损 者 ], 报 废物) 如 : 他 家 的 电视 一 了 、 公 司 
的 电脑 一 了 
+ + 
了 上 十 WHTTh 如 : 他 家 一 了 一 台电 视 、 公 
司 一 了 一 台电 脑 


从 上 面 的 举例 可 以 看 出 ,二 价 动词 “ 扔 ”本 来 只 能 支配 施 事 ( 扔 者 )、 受 
事 ( 扔 物 ) 两 个 论 元 ;但 是 ,进入 三 价 句 式 *NP (A) 十 V 十 NP〈D) 十 
NP (P)” 后 ,使 潜在 的 受 扔 者 可 以 实现 为 与 事 论 元 。 二 价 动词 “ 踢 ” 
本 来 只 能 支配 施 事 ( 踢 者 ) . 受 事 ( 踢 物 ) 两 个 论 元 ,只 有 用 在 踢 足 球 等 
场景 中 , 才 可 能 隐 含 着 接 球 者 这 种 与 事 角色 ;二 价 动词 “ 吃 ” 本 来 只 能 
支配 施 事 ( 吃 者 )、 受 事 ( 吃 物 ) 两 个 论 元 ,只 有 用 在 从 别人 那儿 吃 什么 
东西 的 场景 中 , 才 可 能 隐 含 着 被 吃 者 这 种 与 事 角 色 ; 但 是 ,进入 三 价 
句 式 “NP (A) 十 V 十 NP (D) 十 NP (P)” 后 ,“ 踢 ” 和 “ 吃 ? 都 可 以 支配 
施 事 .与 事 、 受 事 三 个 论 元 。 二 价 动词 “ 坑 ” 本 来 只 能 支配 施 事 ( 坑 者 
一 骗 子 )、 受 事 ( 被 坑 者 一 受 害 者 ) 两 个 论 元 ,只 有 用 在 从 别人 那儿 骗 
取 财 物 等 场景 中 , 才 可 能 隐 含 着 被 骗 的 财物 这 种 受 事 角 色 ; 并 且 ，, 在 
这 种 场景 下 ,原来 的 受 事 ( 被 十 者 一 受害 者 ) 论 元 转变 为 与 事 论 元 。 
一 价 动词 “ 死 ,人 烂 、 报 废 ” 本 来 只 能 支配 一 个 客体 (死者 、 烂 物 、 报 废物 ) 
论 元 ,一 价 动词 “ 飞 ” 本 来 只 能 支配 一 个 施 事 论 元 ( 飞 者 ); 但 是 , 当 它 
们 进入 二 价 句 式 *NP (E) 十 V 十 NE (Th)” 之 后 ,就 额外 多 出 一 个 当 
事 ( 受 害 者 ) 论 元 。 

综 上 所 述 , 句 式 套用 和 动词 代 人 造成 了 角色 错 配 。 角 色 错 配 的 
实质 是 ,动词 的 论 元 结构 跟 句 式 的 论 元 结构 的 不 一 致 ,并 且 是 句 式 的 
论 元 结构 压倒 (override) 了 动词 的 论 元 结构 。 那 么 ,为 什么 动词 要 迁 
就 句 式 往 火 坑 里 跳 呢 。 这 是 受 表 达 精 细 化 这 种 语 用 动机 的 强力 驱使 
而 促成 的 。 比 如 ,为 了 具体 地 表示 给 予 或 取得 的 方式 ,就 用 " 扔 、 灌 、 
踢 . 孝 敬 、 吃 、 穿 、 抽 、 花 、 糟 踢 、 坑 等 动词 代 人 “ 送 、 给 ?类 动词 擅 场 的 
“NP (A) 二 VTTNP (D) 十 NP (P)?” 句 式 ; 为 了 具体 地 表示 失去 的 方 
式 , 就 用 “ 死 `. 飞 .人 烂 、 报 废 "等 动词 ,甚至 是 “被 偷 ” 一 类 动词 性 结构 代 
入 “失去 ”类 动词 擅 场 的 *NP (E) 十 V 十 NP〈Th)” 句 式 。 再 如 : 
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(9) a. 床上 葡 着 一 个 病人 < b. 床上 尖 一 个 病人 

(10) a. 楼 上 住 着 几 个 留学 生 < b. 楼 上 有 几 个 留学 生 
(11) a. 园子 里 种 了 两 棵 囊 树 < b. 园子 里 着 两 哥 囊 树 
(12) a. 墙 上 ， 一 幅 山水 画 < b. 墙 上 有 一 幅 山 水 画 


在 例 (9) 一 (12) 中 ,a 式 和 hb 式 都 表示 存在 ;但 是 ,b 式 表示 抽象 的 存 
在 ,a 式 通过 用 具体 的 动词 性 结构 代 换 抽象 的 存在 动词 “有 ”之 后 , 指 
定 了 具体 的 存在 方式 .9 

这 就 是 说 ,表达 精细 化 (elaboration) 这 种 语 用 动机 , 促 动 了 句 式 
套用 和 动词 代 人 ,最 终 造成 动词 和 句 式 在 论 元 结构 上 的 不 一 致 ,以 至 
很 难 用 动词 的 论 元 结构 来 解释 句子 的 结构 方式 及 其 语义 表达 。 例 


如 :@ 


〈13) a. 一 个 月 的 工资 全 被 他 嚼 了 
<- b. 一 个 月 的 工资 全 被 他 荡 了 
(14) a. 一 个 月 的 工资 爹 被 他 
< b. 一 个 月 的 工资 全 被 他 咏 厦 而 酒 加 
(15) a. 他 把 一 个 月 的 工资 全 更 了 

< b. 他 把 一 个 月 的 工资 全 花 了 

〈16) a. 他 把 一 个 月 的 工资 
< b. 他 把 一 个 月 的 工资 全 荡 上 春季 原 
(17) a. 你 这 样 做 会 被 别人 和 药 挤 天 牙 
<- b. 你 这 样 做 会 被 别 全 珊 的 
(18) a. 我 可 是 想 死 你 啦 ( 王 了 十 啊 ) 
< b. 我 可 是 读本 你 啊 
(19) a. 李 四 被 后 边 的 司机 
< b. 李 四 被 后 边 的 司机 


@ 参考 朱德 申 (1981/1990) ,第 11 页 。 

@ 例 (19a) 出 自 Tan，F. 〈 谭 栈 ) (1991: 166) Notion oF Supject za Chinese. Ph，D. 
dissertation，Stanford University，CA. 转 引 自 潘 海 华 (1997) 第 6 页 。 例 (20a) 引 自 潘 海 华 
(1997) 第 6 页。 
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(20) a. 老师 被 学 生 贴 了 : 

< b. 老 师 被 学 生 拢 判 了 
用 “ 喝 、 喝 了 猫 儿 尿 、 玩 `. 玩 了 麻将 ”代替 “ 花 ”、 用 "“ 笑 掉 大 牙 、 想 死 了 ” 
代替 “ 耻 笑 、 真 想 ”, 用 “ 按 了 一 喇叭 `. 贴 了 大 字 报 ”代替 “警告 了 一 下 、 
批判 子 ”, 造 成 了 (13a) 一 (20a) 这 种 难以 用 核心 动词 的 句法 ,语义 功 
能 来 解释 的 特殊 句 式 。 


3 ” 句 式 对 动词 的 选择 限制 条 件 


他 报 


3.1 句 式 的 不 完全 能 产 性 


如 果 句 式 具 有 配 价 能 力 ,那么 它 可 以 自由 地 指派 (assign) 论 元 ; 
于 是 ,特定 句 式 对 某 种 语义 类 别 的 动词 应 该 具有 相当 的 开放 性 。 但 
是 ,事实 上 ,正如 Goldberg (1995: 120) 所 指出 的 ,许多 句 式 只 是 在 
一 定 程 度 上 具有 能 产 性 (are tised somewhat ,preductively), 即 具有 
部 分 的 能 产 性 (partial productivity) , 而 不 是 完全 的 能 产 性 (full pro- 
ductivity) 。 例 如 .: 


(1) a。Joe gave $5 to the earthquake relief fund. 
->1Ib。 Joe gave the:earthquake relief fund-$$5. 

(2) a，、Joe donated $5 to the earthquake relief fund. 
-~ b.。* Joe donated the earthquake relief fund $ 5. 
(3) a。Joe told the news to Mary. 

一 b.Joe told Mary the news. 

(4) a。Joe whispered the news to Mary. 

-> bx Joe whispered Mary the news. 

(5) a.、Joe baked a cake for Mary. 

一 b. Joe baked Mary a cake. 

(6) a。Joe iced a cake for Mary. 


@ 例子 和 说 明 , 根 据 Goldberg (1995) ,p. 121.130 一 131 改编 。 
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一 bx#*Joe iced Mary a cake. 

〈7) a. She threw a cannonball to him. 

一 b. She threw him a cannonball, 

〈8) a. She blasted a cannonball to him. 

~ bx#* She blasted him a cannonball: 

〈9) Sally permitted / allowed / * let / * enabled Bob a kiss。 

〈10) Sally refused / denied / * prevented / x disallowed 
/ x forbade Bob a kiss. 


从 例 (C1) 一 (8) 可 以 看 出 , 双 及 物 句 式 (Cditrafisitive construction) 对 动 
词 的 选择 是 难以 预测 的 。 比 如 ,同样 是 给 予 义 动词 , give 可 以 ,而 
donate 不 行 ; 同 样 是 言说 义 动词 ,tell 可 以 ,而 whisper 不 行 ; 同 样 是 
制作 (creation) 义 动词 ,bake 可 以 ,而 ice 不行; 同样 是 弹道 运动 (bal- 
listic motion) 义 动词 ,threw 可 以 ,而 blast 不 行 。 从 例 (9) 和 (10) 可 
以 看 出 ,同样 是 许可 (bermission) 义 动词 , permit，allow 可 以 ,而 
let，enable 不 行 ;同样 是 拒绝 (Crefusal) 义 动 词 ,refused，deny 可 以 ， 
而 prevented，disallow，forbid 不 行 。 

汉语 的 情况 也 一 样 ,句法 .语义 性 质 很 接近 的 一 组 动词 ,不 一 定 
都 能 进入 相同 的 句 式 。 例 如 ; 

(11) a. 我 吃 了 弟弟 一 个 苹果 

- < 我 哺 了 弟弟 一 个 猪手 
关 我 鹃 了 弟弟 一 根 香 惹 
- 类 我 尝 了 弟弟 一 口 蛋 汤 
我 穿 过 舅 血 一 件 毛衣 
我 戴 过 舅 鼻 一 项 巾 子 
x 我 披 过 舅舅 一 件 斗 笑 
. * 我 围 过 鼻 血 一 条 纱 中 
动物 园 飞 了 一 只 鹦 荐 
. x 动 物 园 踪 了 一 只 豹子 
* 动物 园 咒 了 一 只 袋鼠 
. xx 动 物 园 跳 了 一 只 猴子 


蕊 “ 


已 -P 


(2) 


7 


和 9? 


〈13) 


人 


吃 . 
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e。 关 动物 园 溜 了 一 只 狐狸 
f.、， = 动物 园 走 了 一 只 孔 管 
gx 关 动物园 滚 了 一 只 猪 获 
hx 动物 园 息 了 一 只 乌龟 
ix 动物 园 游 了 一 只 白 帮 


同样 是 二 价 的 摄食 动词 ,“ 吃 ”可 以 进入 三 价 句 式 , 但 “ 哨 、 嚼 、 尝 ”不 
能 ;同样 是 二 价 的 服饰 动词 “ 穿 . 戴 ?可 以 进入 三 价 句 式 , 但 “ 披 、 围 ” 
不 能 ;同样 是 一 价 的 移动 动词 “ 飞 ? 可 以 进入 二 价 句 式 ,但 “ 蹄 、 蹦 、 
跳 . 溜 . 走 、 滚 . 疏 . 游 ?不 能 。 

对 于 这 种 句 式 的 不 完全 能 产 现象 ,如 果 不 能 找到 合理 和 充分 的 
解释 ;那么 ,名 式 作为 一 种 独立 自主 的 语法 实体 ( 跟 词 汇 一 样 )、 句 式 
可 以 不 依赖 动词 而 指派 论 元 等 论断 的 可 靠 性 就 要 大 打折 扣 了 。 


3.2 语义 场景 和 基本 层次 概念 


关于 名 式 对 动词 的 选择 限制 ,Goldberg (1995) 指 出 : 句 式 必须 指 
定 动词 跟 它们 结合 的 方式 .限定 可 以 通过 各 种 方式 跟 它们 整合 的 动词 
类 别 .指定 动词 所 表示 的 事件 类 型 整合 进 句 式 所 表示 的 事件 类 型 的 方 
式 , 这 就 是 动词 与 句 式 整合 的 原则 (第 49 页 )。 那 么 ,什么 样 的 动词 可 
以 进入 什么 样 的 句 式 呢 ? Goldberg (1995) 指 出 : 动词 所 指 的 事件 类 型 
是 句 式 所 指 的 更 为 一 般 的 事件 类 型 的 实例 。……: 不 包含 直接 跟 句 式 
相关 的 意义 的 动词 经 常 指 一 种 实施 这 种 行为 的 方式 (第 60 页 )。 用 这 
种 标准 来 衡量 $ 3. 1 中 的 例 (1) 一 (13) ,那么 我 们 就 会 产生 疑惑 : 为 什 
人 么 give\tell\bake ,threw、permit,allow\refuse.deny 可 以 作为 双 及 物 句 
式 表 示 的 各 种 转让 意义 的 实例 ,而 意义 相似 的 donate、whisper \ice、 
blast \let enable、prevente ,disallow ,forbid 却 不 行 ? 为 什么 “ 吃 、 穿 、 戴 ” 
可 以 作为 双 宾 语句 式 表 示 的 各 种 取得 意义 的 实例 ,而 意义 相似 的 “ 哗 、 
嚼 、 党 、 披 、 围 ?" 却 不 行 ? 为 什么 “ 飞 ? 可 以 作为 "<NP CE) 十 V 十 NP (Th)” 
句 式 所 表示 的 丧失 意义 的 实例 (具体 地 指示 了 丧失 的 方式 ) ,而 意义 相 
似 的 “ 蹄 .蹦跳 . 溜 . 走 滚 . 慌 . 游 " 却 不 行 ? 

根据 上 文 8$2.2 的 讨论 ,不 包含 跟 某 种 句 式 直接 相关 的 意义 的 
动词 (简称 边缘 动词 ) ,是 通过 套用 这 种 句 式 、 代 换 包 含 跟 该 句 式 直接 
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相关 的 意义 的 动词 ( 即 典型 动词 ) 而 进入 这 种 句 式 的 。 边 缘 动 词 的 意 
义 必 须 可 以 解释 为 典型 动词 的 意义 的 一 个 次 类 ,前 者 具体 地 例 示 
(instantiate) 后 者 的 手段 (means) 方式 (manner)、 条件 (precondi- 
tion)、 结 果 (result) 等 ,从 而 使 语言 表达 更 加 精细 化 。 比 如 ,bake、 
threw、permit ,allow ,refuse、deny 等 说 明了 给 予 (或 不 给 予 ) 的 具体 
的 方式 或 条 件 ， 吃 、 穿 . 戴 ? 说 明了 取得 的 手段 或 结果 ,“ 飞 ”说 明了 均 
失 的 方式 。 但 是 , 受 动词 意义 必须 跟 句 式 意义 相 协调 的 原则 的 制约 ， 
这 种 精细 化 表达 是 有 一 定 的 限度 的 ;具体 地 表现 为 : 句 式 只 能 容忍 
在 概念 层级 上 比 典 型 动词 低 一 个 级 别 的 边缘 动词 .而 不 能 容忍 比 典 
型 动词 低 两 个 .或 更 多 级 别 的 边缘 动词 。 比 如 ,tell,threw 等 可 以 看 
作 是 give 的 低 一 个 级 别 的 实例 ,而 whisper、\blast 则 是 更 为 下 位 的 
方式 动词 ;“ 吃 、 穿 , 戴 ” 等 可 以 看 作 是 “ 拿 "等 取得 意义 的 下 位 动词 ,而 
“ 噶 、. 嚼 、 尝 \、 披 . 围 ? 则 是 “ 吃 、 穿 、. 戴 ?等 的 下 位 动词 ,表示 更 加 具体 的 
方式 或 手段 。 如 果 引 入 Lakoff (1987) 中 关于 基本 层次 范畴 (basic- 
level categories) 的 概念 ,那么 我 们 可 以 发 现 : 能 替换 典型 动词 进入 
某 种 句 式 的 边缘 动词 必须 是 表示 基本 层次 概念 的 。 像 上 面 的 “ 吃 、 
穿戴 ?等 是 表示 基本 层次 概念 的 ,而 “ 哺 、 嚼 、 尝 、 披 . 围 ? 则 是 表示 上 比 
基本 层次 概念 更 为 具体 和 下 位 的 概念 的 。 再 如 ， 


(1) a. 我 扔 小 明 一 个 高 抛 球 

. 我 踢 小 明 一 个 儿 线 球 

.xx 我 硅 小 明 一 个 斜 线 球 
.x 我 顶 小 明 一 个 斜 线 球 
. # 我 忆 小 明 一 个 儿 线 球 
x 我 钓 小 明 一 个 斜 线 球 
.x 我 铲 小 明 一 个 斜 线 球 
. 我 传 小 明 一 个 高 抛 球 

. x 我 托 小 明 一 个 高 抛 球 
x 我 热 小 明 一 个 高 抛 球 
. x 我 推 小 明 一 个 斜 线 球 
. x 我 扣 小 明 一 个 儿 线 球 


PN 
Mo 
SEA 
pp crop ho pp 
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例 (1) 中 的 动词 都 是 用 于 足球 运动 这 种 场景 的 ,对 于 传送 足球 这 种 动 
作 来 说 , 扔 、 踢 ?是 表示 基本 层次 概念 的 ,而 “ 矿 、 项 ` 甩 、 钧 、 铲 " 则 是 
更 加 具体 和 专门 的 动作 。 例 (2) 中 的 动词 都 是 用 于 排球 运动 这 种 场 
景 的 ,对 于 传送 排球 这 种 动作 来 说 ， 传 ?是 表示 基本 层次 概念 的 ,而 
“ 托 . 垫 、 推 . 扣 ? 则 是 更 加 具体 和 专门 的 动作 。 

因为 一 个 句 式 只 能 表示 一 个 场景 (scene) ,句子 所 表示 的 语义 场景 作 
为 一 种 理想 化 的 \ 内 部 一 致 的 个 别 性 的 行为 或 过 程 ,? 它 通常 是 由 典型 
的 、 容 易 激 活 这 种 情景 的 动词 来 表达 的 。 特 别 是 当 句 式 通过 引申 用 法 
而 接纳 边缘 动词 来 充当 谓语 核心 时 ,要 求 动词 所 传达 的 意义 尽 可 能 地 
接近 典型 动词 ,至少 可 以 解释 为 是 典型 动词 的 直接 的 下 位 概念 (比如 ， 
表示 了 典型 动词 所 表示 的 动作 行为 的 具体 的 方式 )。 一 般 地 说 ,这 种 
表示 了 某 种 上 位 动作 和 行为 的 动词 是 基本 层次 的 概念 ,表示 更 为 具体 
和 专门 的 动作 和 行为 的 方式 的 动词 一 般 是 非 基 本 层次 的 概念 。 


3.3 义 项 固定 \ 词 汇 衔 生 和 论 元 结构 改变 


对 于 某 种 句 式 来 说 ,边缘 动词 的 意义 跟 这 种 句 式 的 意义 是 有 一 
定 差距 的 。 为 了 让 动词 更 好 地 适合 句 式 意义 ,特别 是 为 了 让 动词 的 
参与 角色 能 跟 句 式 的 论 元 角色 相 熔 合 (fusion); 有 一 种 词汇 化 (lexi- 
calization) 的 办 法 可 以 使 边缘 动词 逐渐 盘 近 并 成 为 典型 动词 , 那 就 
是 : 在 句 式 意义 的 强力 渗透 和 典型 动词 的 同化 (assimilation) 作 用 
下 ,边缘 动词 本 身 引申 出 跟 句 式 意义 相 吻 合 的 新 的 义 项 ,或 者 说 是 名 
式 意义 部 分 地 积淀 和 固化 到 词 项 意义 上 例如 ;2 


(1) a。Pauling smiled. 


( 鲍 玲 露出 了 微笑 ) 
b。Pauling smiled her thanks/approval. 
(〈 鲍 玲 以 微笑 表示 谢意 /同意 ) 


@ Fillmore (1977: 84) 对 场景 的 定义 是 : 一 个 理想 化 的 内 部 一 致 的 个别 性 的 感 
觉 、. 记 忆 、 经 验 、 行 为 或 事物 。 

四 “例子 和 释义 ,分 别 参考 Goldberg (1995);《 和 牛津 高 级 英汉 双 解 词典 》( 第 四 版 增补 
本 ) ,商务 印 书馆 ,2002 年 愉 新 英汉 词典 》( 增 补 本 ), 上 海 译文 出 版 社 ,1985 年 。 
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(2) a。 My fathet frowned. 
(我 父亲 秆 届 头 了 ) 
b。My parents always frown on late night out. 
〈 我 父母 向 来 不 赞成 深夜 外 出 ) 
c，My father frowned away the compliment and the insult. 
《我 父亲 用 争 届 头 来 击 退 阿 讽 和 冒犯 ) 
《3) a。Bees are Swarming in the garden。 
(蜜蜂 在 花园 里 成 群 地 飞 ) 
b.，The crowd was swarming out through the gate. 
(人 和 群 一 帘 蜂 地 从 大 门 涌 出 ) 
ccrowds Swarming' in the Streets 
〈 街 上 拥挤 不 堪 的 人 和 群 ) 
d.，T 开 he garden is svwarrming with bees. 
(花园 里 到 处 飞 满 了 蜜蜂 ) 
〈4) a。 Thunder is rumbling in the distance. 
〈 远 处 的 雷 声 隆 隆 作 响 ) 
TI am so hungry that my stomachys rumbling. 
(我 狐 得 肚子 咕 咕 叫 ) 
b. The trams are rumbling through the streets。 
〈 电 车 发 着 较 较 声 驰 过 大 街 ) 
The truck rumbled down the street. 
(卡车 发 出 声 驰 过 大 街 ) 
《5) a，The 全 es are buzzing round a pot of jam. 
〈 苞 晶 围 着 果 普 锥 头 喻 喻 叫 ) 
b， The fly buzzed into the room。 
〈 那 只 苍蝇 喻 喻 叫 着 [ 飞 ] 进 房间 ) 


《la) 中 不 及 物 的 smile 本 来 指 微笑 (give a smile) ,这 是 一 种 用 以 表 
示 幸 福 、. 快 乐 `. 满 足 的 行为 和 表情 ;扩大 到 用 微笑 来 表示 某 种 信息 
《express sth by means of a smile) ,引申 出 (1b) 这 种 及 物 动 词 的 意义 
和 用 法 。 同 样 地 ,(2a) 中 不 及 物 的 frown 本 来 指 皱眉 ,这 是 一 种 用 以 
表示 生气 .沉思 ,忧愁 的 行为 和 表情 ,扩大 到 用 皱眉 来 表示 不 赞成 , 引 
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申 出 (2b) 这 种 及 物 动 词 的 意义 和 用 法 ;再 引申 一 步 ,很 容易 引申 出 
(2c) 这 种 指 用 皱眉 来 做 某 事 的 意义 ,尽管 一 般 的 辞书 还 没有 收录 这 
个 义 项 。(3a) 中 不 及 物 的 swarm 本 来 指 (蜜蜂 ) 成 群 飞行 ,引申 指 
(3b) 所 示 的 成 群 地 移动 和 (3c) 所 示 的 聚集 ,最 后 引申 指 ( 某 处 ) 挤 满 
了 (人 或 物 ) 。(4a) 中 的 rumble 本 来 指 发 出 持续 的 低沉 的 声音 ,引申 
指 C4b) 所 示 的 发 出 低沉 的 声音 ( 沿 着 某 个 方向 ) 行 进 ; 相 似 地 ,(5a) 中 
的 buzz 本 来 指 发 出 喻 喻 的 声音 ,用 在 (5b) 这 样 的 句 式 中 ,很 容易 引 
申 出 指 发 出 喻 喻 的 声音 ( 沿 着 某 个 方向 ) 行 进 这 种 意义 ,尽管 一 般 的 
辞书 还 没有 收录 这 个 义 项 。 这 种 增加 义 项 的 办 法 主要 针对 个 别 语义 
有 特异 性 的 词汇 。 新 的 义 项 带 来 新 的 跟 句 式 更 加 吻合 的 论 元 结构 。 

针对 成 批 的 有 句法 :语义 共性 的 动词 小 类 ,可 以 通过 词汇 衍生 
(lexical derivation) 手 段 ,在 不 改变 词义 的 情况 下 改变 动词 原 有 的 论 
元 结构 ,从 而 创造 出 适合 某 种 句 式 的 某 种 类 型 的 动词 或 动词 性 结构 
的 特有 的 论 元 结构 。 例 如 : 


(6) a。 门口 叶 着 一 个 小 孩 
b。* 门口 有 着 一 个 小 孩 

(7) a. 身后 站 着 一 个 卫兵 
b.。 身后 笑 着 一 个 卫兵 

(8) a。 桌子 上 放 着 一 本 词典 
bx 桌子 上 做 着 一 个 蛋糕 

(9) a. 墙 上 画 着 一 幅 山水 画 
b。x* 床上 脱 着 一 双 红 袜子 

(10) a. 小 明 在 桌子 上 放 了 一 本 词典 
b。 桌子 上 被 小 明 放 了 一 本 词典 
c。 桌子 上 小 明 放 了 一 本 词典 
d. 桌子 上 放 了 一 本 词典 

(11) a. 老 张 在 墙 上 画 了 一 幅 山 水 画 
b. 墙 上 被 老 张 画 了 一 幅 山 水 画 
c. 墙 上 老 张 画 了 一 幅 山 水 画 
d. 墙 上 画 了 一 幅 山 水 画 
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从 例 (6)(7) 来 看 ,同样 是 一 价 动词 ,为 什么 “ 蹲 , 站 ?可 以 进入 "NL 二 V 
着 十 NP" 句 式 , 而 “ 冉 . 笑 ? 却 不 能 ? 从 例 (8)(9) 来 看 ,同样 是 二 价 动词 ， 
为 什么 “ 放 , 画 ?可 以 进入 "NLT 二 V 着 十 NP” 句 式 , 而 “做 、 脱 ? 却 不 能 ? 
从 句 式 语法 的 角度 ,可 以 这 样 回答 : 因为 存在 句 式 “NL 十 V 着 十 NP” 
表示 一 种 存在 状态 ,要 求 其 中 的 动词 必须 是 包含 [状态 ]5 附 着] 意义 
的 定位 (placement) 动 词 。Q 也 就 是 说 “ 蹲 站 、 放 \ 画 ?在 语义 上 都 隐 含 
着 一 个 处 所 论 元 ;因此 “ 蹲 、. 站 ”实际 上 是 能 支配 客体 (theme) 和 处 所 
(location) 两 个 内 在 角色 (intrinsic role) 的 二 元 动词 ,“ 放 \ 画 ”实际 上 是 
能 支配 施 事 、 客 体 和 处 所 三 个 内 在 角色 的 三 元 动词 。 

令 人 感 兴 趣 的 问题 是 ,在 存在 句 “NL 二 YV 着 十 NP” 中 ,为 什么 不 能 
出 现 施 事 论 元 ? 一 种 办 法 是 ,假设 “ 放 \` 画 等 定位 动词 有 两 种 论 元 结 
构 : 一 种 有 施 事 论 元 ,如 例 (10arc) 和 (1la-c) 所 示 ; 一 种 没有 施 事 论 元 ， 
如 例 (8a) 和 (9a) 所 示 。 但 是 ,这 类 动词 是 大 量 的 ,这 种 增加 义 项 的 做 法 
会 大 大 地 增加 说 话 人 大 脑 中 心理 词典 (mental dictionary) 的 负担 ;也 不 
符合 儿童 语言 习 得 的 实际 情况 ,没有 证 据 表 明 儿 童 把 (8 一 9) 和 (10 一 
11) 中 的 “ 放 ,` 画 ?等 当 作 两 种 义 项 来 学 习 的 。 为 此 ,Pan (1996) 提出 了 
一 条 通用 的 词汇 规则 一 一 施 事 删除 (agent deletion) 规 则 。 即 非 完成 体 
标记 “着 ?附着 在 动词 之 后 ,可 以 把 施 事 论 元 删除 ;“ 着 2 引发 施 事 删 除 
的 条 件 是 : 〈i) 相关 动词 是 定位 动词 ,具有 { 施 事 , 客 体 ,处 所 } 三 种 论 元 
角色 ;ii 客体 和 处 所 有 一 种 像 主语 和 谓词 一 样 的 关系 , 即 处 所 是 客体 
所 在 的 地 方 .@ 因此 ,下 面 这 种 句子 是 不 合格 的 : 


(12) a。x 桌子 上 小 明 放 着 一 本 词典 
b。 xx 桌子 上 被 小 明 放 着 一 本 词典 
〈13) ax 墙 上 老 张 画 着 一 幅 山 水 画 


@ 关于 这 种 动词 的 语义 特征 和 句法 表现 , 详 见 朱德 四 (1981/1990) 等 著作 。 

@ 为 了 生成 合格 的 处 所 倒 装 名 (location inversion sentence) , 潘 海 华 (1997: 10) 修 正 了 词 
汇 映 射 理论 (lexical mapping theory) 中 的 特殊 默认 分 类 (special default classification) : 赋予 施 事 
〈 它 是 可 有 可 无 的 ) 一 种 [十 受 限 制 ] 的 特征 (因此 只 能 作 由 介词 引导 的 间接 格 或 语义 上 受到 限 
制 的 宾语 ) ,赋予 客 体 一 种 5 十 焦点 ] 的 特征 (因此 只 能 居于 动词 后 面 宾语 的 位 置 ) ,赋予 处 所 一 
种 5( 受 限制 ] 的 特征 (因此 可 以 作 主 语 或 宾语 ) 。 于 是 ,对 于 由 “着 ?引发 的 删除 了 施 事 的 动词 来 
说 ,其 客体 论 元 只 能 作 宾 语 ,其 处 所 论 元 只 能 作 主 语 (因为 宾语 位 置 已 经 被 客体 占领 了 ) 。 
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b. 关 墙 上 被 老 张 画 着 一 幅 山 水 画 


显然 , 施 事 删 除 规则 无 法 推广 到 例 (10b 一 d) 和 (11b 一 d) 这 种 动词 带 
“了 ?的 句子 上 。 因 为 ,在 这 种 句子 中 , 施 事 可 以 不 出 现 , 如 例 (10d) 和 
(11d) 所 示 ; 但 也 可 以 出 现 , 如 例 (10b 一 和 (11b 一 所 示 。 为 此 ;我们 
吸收 顾 阳 (1997/1999) 和 潘 海 华 (1997) 的 若干 思想 ,作出 如 下 假设 : 在 
例 C10b 一 和 (11b 一 c) 中 ,动词 的 论 元 结 枸 经 历 了 另 一 种 词汇 规则 的 
作用 , 那 就 是 广义 被 动 化 Cgeneralized passivization) 规 则 .0 在 这 种 广 
义 被 动 化 规则 的 作用 下 ,处 所 论 元 升级 (promotion) 了 ,表现 为 : 不 


@ 顾 阳 (1997) 采 纳 Levin & Rappaport (1995) 的 理论 假设 : 在 词 库 (lexicoa) 和 名 
法 表达 (syntactic representation) 层 面 之 间 有 两 个 界面 : (i) 词汇 语义 表达 式 (lex ical-se- 
mantic representation) , (ii) 词汇 句法 表达 式 (lexical-syntactic representation) ,也 称 为 论 元 
结构 (argumerit structure) ;词汇 从 词 库 到 句法 层面 要 先 经 过 词汇 语义 表达 式 , 再 经 过 词汇 
句法 表达 式 。 某 些 词 汇 经 过 这 两 个 层面 可 以 衍 变 为 新 的 词汇 ,如 非 宾 格 动词 Cunaccusati- 
ve verb) 中间 动词 (middle verb) 等 。 并 认为 “着 ”规则 ( 即 施 事 删除 规则 ) 作 用 于 词汇 语 
义 表达 层面 ;由 于 词汇 语义 表达 式 和 句法 层面 之 间隔 了 一 个 词汇 句法 表达 式 , 因 而 被 控制 
的 施 事 在 句 法 表达 层面 上 是 绝对 反映 不 出 来 的 。 而 被 动 化 规则 作用 于 词汇 句法 表达 式 
〈 论 元 结构 ) 层 面 , 即 在 词汇 句法 表达 式 ( 论 元 结构 ) 层 面 上 施 事 论 元 受到 控制 ;由 于 词汇 句 
法 表达 式 和 向 法 表达 层面 之 间 不 存在 其 他 表达 式 , 因 而 受 控制 的 施 事 在 句 法 层面 上 仍然 
可 以 表现 出 来 (第 23 页 )。 但 是 ,她 没有 提 到 “桌子 上 小 明 放 了 一 本 词典 . 墙 上 老 张 画 了 一 
幅 山水 画 ? 这 类 句子 ;因此 ,我 们 不 知道 在 她 心目 中 这 种 句子 是 主动 式 还 是 被 动 式 。 潘 海 
华 (1997) 采 用 的 是 词汇 映射 理论 (lexical mapping theory, 简 称 LMT) ,相信 在 词 库 和 句法 
表达 层面 之 间 只 有 一 个 层次 , 那 就 是 论 元 结构 。 因 此 ,他 不 利用 层次 的 概念 ,而 只 是 规定 
施 事 删除 规则 和 被 动 化 规则 的 操作 结果 不 同 :着 ?规则 确实 把 施 事 给 删除 了 ,而 被 动 化 规 
则 只 是 把 施 事 降 级 了 (第 12 一 13 页 )。 另 外 ,他 认为 带 “ 了 ?的 存 现 句 是 有 多 种 来 源 的 。 例 
如 : 


(1) a。 桌子 上 小 明 放 了 一 本 词典 一 b。、 桌子 上 放 了 一 本 词典 
(2) a. 墙 上 老 张 画 了 一 幅 山 水 画 一 b. 墙 上 画 了 一 幅 山 水 画 
(3) a、 桌子 上 被 小 明 放 了 一 本 词典 一 b. 桌子 上 放 了 一 本 词典 
(4) a. 墙 上 被 老 张 画 了 一 幅 山 水 画 一 b. 墙 上 画 了 一 幅 山 水 画 


他 把 (la)(2a) 中 的 处 所 词语 “桌子 上 、 墙 上 ?看 作 是 话题 ,把 其 中 的 施 事 “ 小 明 、 老 张 ” 看 作 
是 主语 ;而 把 (3a)(4a) 中 的 处 所 词语 “桌子 上 、 墙 上 ?看 作 是 主语 ,其 中 的 施 事 “ 小 明 、 老 张 ? 
看 作 是 间接 格 。 并 且 , 他 认为 “桌子 上 放 了 一 本 词典 . 墙 上 画 了 一 幅 山 水 画 等 存 现 句 是 有 
歧义 的 : 它们 既 可 以 是 从 (la)(2a) 删 除 施 事主 语 而 得 到 的 (1b)(2b) ,也 可 以 是 从 (3a) (4a) 
删除 间接 格 施 事 而 得 到 的 (3b)(4b)( 第 10 一 11 页 ) 。 
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需要 介词 引导 直接 作 句 子 的 主语 和 话题 ;但 是 , 施 事 论 元 被 降级 
(Cdemotion) 了 ,表现 为 : (iD) 或 者 用 介词 “被 2 引导 ,居于 修饰 语 ( 状 
语 ) 的 位 置 ,如 例 (10b) 和 (11b) 所 示 ;(iD 或 者 不 用 介词 “被 > 引导， 
居于 内 层 主语 (小 主语 ) 的 位 置 , 如 例 (10c) 和 (11c) 所 示 ;( 进 ) 或 者 
于 脆 省 略 掉 , 如 例 (10d) 和 (11d) 所 示 。“ 了 ?引发 施 事 降 级 的 条 件 
是 :iD 相关 动词 是 定位 动词 ,具有 { 施 事 , 客 体 , 处 所 } 三 种 论 元 角 
色 ;(i 客体 论 元 和 处 所 论 元 有 一 种 像 主 语 和 谓词 一 样 的 关系 , 即 
处 所 是 客体 所 在 的 地 方 ;(iii) 客体 论 元 是 句子 的 焦点 (focus) ,处 所 
论 元 是 已 知 信息 (given information) 。 通 过 这 种 在 词汇 规则 控制 下 
的 词汇 衡 生 过 程 , 在 不 改变 词义 的 情况 下 得 到 了 跟 句 式 的 论 元 结 
构 相 匹配 的 动词 的 论 元 结构 。 显 然 , 这 是 一 种 比 增加 义 项 要 经 济 
得 多 的 手段 ;并 且 , 对 于 语言 学 习 者 来 说 也 有 相当 的 可 学 性 (learn- 
ability) 。 


4 句 式 扩张 的 认 知 基础 和 逻辑 机 制 


4.1 句 式 套用 的 认 知 基础 : 隐喻 投射 和 完 形 包装 


上 文 (2.2 和 8$2.3) 指 出 ,名 式 套用 和 动词 代 和 人 不仅 使 得 动 
词 的 配 价 跟 名 式 配 价 不 一 致 ,而 且 还 造成 了 角色 错 配 , 即 动词 的 论 元 
结构 跟 句 式 的 论 元 结构 的 不 一 致 ,并 且 是 句 式 的 论 元 结构 压倒 了 动 
词 的 论 元 结构 。 现 在 的 问题 是 : 句 式 套用 的 认 知 基础 是 什么 ? 换 句 
话说 , 当 甲 类 动词 套用 乙 类 动词 的 习 用 句 式 时 ,说 话 人 在 其 概念 结构 
中 到 底 做 了 些 什么 工作 呢 ? 一 个 简单 的 回答 是 隐喻 投射 (metaphor 
projection), 即 把 跟 乙 类 动词 及 其 习 用 句 式 相 关 的 概念 结构 投射 到 
甲 类 动词 上 ,从 而 把 甲 类 动词 所 表示 的 事件 纳入 乙 类 动词 及 其 习 用 
句 式 所 表示 的 事件 图 式 (event scheme) 中 。 例 如 : 


(1) a. 大 张 扔 小 刘 一 色香 烟 
< a. 大 张 给 小 张 一 包 香 烟 
b.。 小平 项 地 伟 :一 本 自 洒 
< 二 b. 小 平 给 李 伟 一 杯 白 酒 
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骂 小 华 一 个 斜 线 球 

吴 小 华 一 个 针线 球 

孝 数 公公 一 条 香烟 
图 愉 公 - 尖 刘 
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< 5. 楼 上 有 人 几 个 留学 生 
c. 园子 里 种 了 两 棵 志 树 
< c'. 园子 里 渍 两 棵 惠 树 
d. 墙 上 对 李 一 幅 员 水 画 
<d. 墙 上 有 一 幅 山 水 画 


在 例 (1) 中 ,把 双 及 物 动词 “给 及 其 习 用 的 双 宾 句 式 所 表示 的 “给 予 ” 
性 转让 的 概念 结构 投射 到 “ 扔 、 灌 、 踢 .孝敬 ”等 动词 所 表示 的 事件 上 ， 
从 而 把 “ 扔 \ 灌 、 踢 、 孝 敬 ?等 单 及 物 动词 所 表示 的 事件 纳入 双 宾 句 式 
之 中 ,使 扔 ` 灌 、 踢 .孝敬 等 行为 成 为 给 予 行为 的 一 种 具体 的 方式 。 在 
例 (2) 中 ,把 双 及 物 动 词 “ 拿 "及 其 习 用 的 双 宾 句 式 所 表示 的 “获取 ”性 
转让 的 概念 结构 投射 到 “ 吃 、 穿 . 抽 、 花 、 糟 踢 、 坑 ”等 单 及 物 动词 所 表 
示 的 事件 上 ,从 而 把 “ 吃 、 穿 . 抽 、 花 、 糟 踢 、 坑 ”等 动词 所 表示 的 事件 纳 
入 双 宾 句 式 之 中 ,使 吃 . 穿 、 抽 、 花 、 糟 踢 、 坑 等 行为 成 为 获取 行为 的 一 
种 具体 的 方式 。 在 例 (3) 中 ,把 及 物 动词 “失去 ”及 其 习 用 的 主动 宾 句 
式 所 表示 的 “消失 ”性 受 损 的 概念 结构 投射 到 “ 死 . 飞 . 烂 . 报 废 、 被 偷 
等 动词 或 动词 性 结构 所 表示 的 事件 上 ,从 而 把 “ 死 `. 飞 、 烂 .报废 、 被 
偷 ” 等 动词 或 动词 性 结构 所 表示 的 事件 纳入 主动 宾 句 式 之 中 ,使 死 、 
飞 \ 烂 报废、 被 偷 等 行为 成 为 损失 行为 的 一 种 具体 的 方式 。 在 例 (4) 
中 ,把 存在 动词 “有 ?及 其 习 用 的 处 所 性 存在 句 式 所 表示 的 处 所 性 存 
在 的 概念 结构 投射 到 “ 躺 着 、 住 着 、 种 了 、 挂 了 ”等 动词 性 结构 所 表示 
的 事件 上 ,从 而 把 “ 躺 着 、 住 着 、 种 了 、 挂 了 ”等 动词 性 结构 所 表示 的 事 
件 纳入 存在 句 式 之 中 ,使 躺 着 、 住 着 、 种 了 、 挂 了 等 状态 成 为 处 所 性 存 
在 的 一 种 具体 的 方式 。 这 正好 体现 了 句 式 语法 关于 句 式 语 义 和 词 项 
语义 互动 (interaction of construction meaning and lexical meaning) 
的 观念 : 句 式 提供 了 结构 上 及 语义 上 的 基本 框架 ,各 个 词汇 成 分 根 
据 其 词类 功能 而 填 人 句 式 框架 的 各 种 位 置 . 并 对 整个 句子 的 语义 作 
出 贡献 . 吕 在 这 里 ,是 谓语 动词 的 语义 使 得 给 予 、 获 取 、 丧 失 、 存 在 等 
句 式 意义 增加 了 方式 的 意义 。 


〇 参考 黄 居 仁 等 (1999) 的 有 关 讨 论 ,第 427 一 428 页 。 
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从 上 面 的 讨论 可 以 看 出 ,在 把 乙 类 动词 的 概念 结构 通过 隐喻 来 
投射 到 甲 类 动词 的 概念 结构 上 的 同时 , 甲 类 动词 的 概念 结构 被 整合 
进 了 乙 类 动词 的 概念 结构 ;于 是 , 甲 类 动词 在 套用 乙 类 动词 的 惯用 名 
式 的 同时 ,不 仅 获得 了 乙 类 动词 的 这 种 惯用 句 式 的 句 式 意义 ,而 且 还 
增加 了 由 甲 类 动词 所 带 和 人 的 意义 。 比 如 , 例 (1a 一 qd) 不 仅 表示 给 予 
还 指示 了 具体 的 给 予 方式 ; 例 (2a 一 D) 不 仅 表示 获取 ,还 指示 了 具体 
的 获取 方式 ; 例 (3a 一 e) 不 仅 表示 损失 ,还 指示 了 具体 的 损失 的 方式 ; 
例 (4a 一 qd) 不仅 表示 存在 ,还 指示 了 具体 的 存在 方式 。 换 句 话 说 ,名 
式 套用 的 语义 后 果 是 把 两 种 概念 结构 整合 成 一 种 新 的 复合 性 的 概念 
结构 ,形成 一 种 新 的 认 知 图 式 。 或 者 说 ,把 两 种 事件 结构 整合 进 一 个 
完 形 (Gestalt) 中 ,用 一 个 认 知 图 式 来 包装 一 个 复合 事件 。 例 如 : 


(5) a. 一 个 月 的 工资 全 被 他 | 罚 本 锋 儿 原 
< b. 一 个 月 的 工资 全 被 他 范 了 


在 5a) 中 , 花 钱 和 喝酒 两 个 事件 被 整合 进 一 个 心理 图 式 中 , 即 用 一 
完 形 来 包装 。 

但 是 , 句 式 对 事件 结构 的 完 形 包装 是 有 一 定 的 限度 的 。 一 
言 可 以 选择 某 些 ( 操 该 语言 的 人 们 认为 ) 在 认 知 上 重要 的 事件 :经 验 
和 知识 用 某 种 (或 某 些 ) 名 式 来 表达 。 至 于 选择 哪些 事件 、 经 验 和 知 
识 ,这些 知 识 如 何 通则 化 (generalize), 则 并 无 固定 不 变 的 程式 可 循 。 
这 就 造成 了 名 式 跟 所 表达 的 事件 之 间 的 对 应 关系 是 有 理 可 循 的 ( 即 
有 理据 的 ,motivated) ,但 是 选择 何 种 对 应 又 不 是 某 种 固定 形式 的 规 
律 所 能 预测 的 ( 即 是 任意 的 ,arbitrary).@ 例如 : 


(6) a. 张大 区 飞 了 一 只 鹦 厚 
b.? 张大 和 苑 飞 了 一 只 风筝 
cx 张大 和 飞 了 一 个 气球 
d. 关 张 大 苑 杜 了 一 个 气球 


@ 参考 黄 居 仁 等 (1999) ,第 415 一 416 页 。 
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为 什么 张大 和 爷 丧 失 了 一 只 鹦 吏 可 以 套用 句 式 “NP (E) 十 V 十 NP 
CTh)”, 说 成 “张大 和 苑 飞 了 一 只 鹦 并 >; 这 是 可 以 解释 的 : 因为 张大 和 爷 
是 损失 事件 的 经 历 者 、 一 只 鹦 璐 是 所 损失 的 客体 .而 飞 的 行为 又 是 丧 
失 行 为 的 一 个 实例 (客体 鹦 囊 通过 飞 走 的 方式 使 经 历 者 受到 损失 ) 。 
但 是 ,为 什么 风筝 .气球 通过 飞 走 、 际 走 的 方式 使 张大 爷 受 到 损失 就 
不 能 套用 句 式 “NP (E) 十 V 十 NP (Th)”, 这 就 不 容易 说 出 一 个 令 人 
信服 的 解释 来 。 正 是 这 种 事件 结构 和 句 式 包装 之 间 任 意 性 的 对 应 关 
系 ,造成 了 8 3.1 所 说 的 句 式 的 不 完全 能 产 性 , 即 语义 性 质 相 似 的 动 
词 不 一 定 都 能 进入 某 种 句 式 。 


4.2 ”归纳 和 类 推 : 
超越 动词 配 价 和 句 式 构造 之 间 的 循环 论证 
基于 词汇 主义 立场 的 动词 的 配 价 或 论 元 结构 研究 ,受到 猛烈 批 
评 的 一 个 理由 是 它 陷 于 循环 论证 (ceircularity) 。Goldberg (1995 ， 
11) 举 了 下 面 的 例子 来 说 明 这 一 点 : 


(1) 工 he horse kicks. 

《2) Pat kicked the wall. 

(3) Pat kicked at the football. 

(4) Pat kicked Bob black and blue. 

(5) Pat kicked the football into the stadium. 
〈6) Pat kicked Bob the football. 


在 (1) 中 ,kick 是 一 元 动词 ,因为 它 带 了 一 个 补足 语 ;在 (2 一 3) 中 ， 
kick 是 二 元 动词 ,因为 它 带 了 两 个 补足 语 ;在 (4 一 6) 中 ,kick 是 三 元 
动词 ,因为 它 带 了 三 个 补足 语 。 这 等 于 是 说 : 断定 kick 有 可 以 带 -nm 
种 论 元 的 意义 Cnrargument sense) 是 基于 它 可 以 跟 n 种 补足 语 共 现 
这 种 事实 ,而 同时 又 声称 kick 可 以 跟 n 种 补足 语 共 现 是 因为 官 看 可 
以 带 n 种 论 元 的 意义 。 这 就 造成 了 循环 论证 。 张 伯 江 (1999:。 183) 
和 沈 家 迷人 2000: 292) 也 出 于 这 种 对 循环 论证 的 顾忌 , 转 而 强调 名 式 
配 价 比 动词 配 价 更 重要 ,只 有 树立 句 式 配 价 的 观念 才能 避免 循环 论 
证 和 ”* 词 无 定价 ` 离 句 无 价 ” 的 厄运 。 
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现在 ,我 们 要 问 的 问题 是 : 句 式 配 价 或 句 式 的 论 元 结构 的 理 
论 能 够 逃脱 循环 论证 的 厄运 吗 ? 答案 是 不 可 能 。 比 如 ,如 果 问 为 
什么 “他 扔 我 一 个 球 ” 属 于 三 价 句 式 , 那 么 回答 : 因为 它 跟 * 他 送 我 
一 本 书 ” 一 样 有 施 事 、 受 事 和 与 事 三 个 论 元 ;如 果 问 为 什么 二 元 动 
词 “ 扔 ”在 句子 “他 扔 我 一 个 球 ” 中 可 以 跟 施 事 、 受 事 和 与 事 三 个 论 
元 共 现 , 那 么 回答 ; 因为 “他 扔 我 一 个 球 ” 是 三 价 句 式 。 可 见 , 当 沈 
家 迷 (2000: 293) 按 照 Goldberg (1995) 的 思路 ,把 配 价 看 作 是 句 式 
的 属性 ,将 句 式 配 价 定义 为 指 抽象 的 句 式 配备 的 ` 与 谓语 动词 同 现 
的 名 词性 成 分 的 数目 和 类 属 ( 指 施 事 、 受 事 、 与 事 ` 工 具 ) 时 ;就 注定 
了 要 卷 人 句 式 的 配 价 数目 由 句 式 中 的 论 元 数目 来 决定 、 句 式 中 的 
论 元 数目 由 句 式 的 配 价 数目 来 解释 的 循环 圈 , 从 而 使 得 用 句 式 配 
价 来 更 好 地 说 明 动 词 跟 相关 名 词性 成 分 在 组 配 上 的 合格 性 的 目标 

其 实 , 根 据 我 们 的 想法 ,只 要 找到 一 个 合适 的 逻辑 起 点 ,那么 
上 述 循环 论证 都 是 可 以 避免 的 。 比 如 ， ee 20) 
“分 析 语 言 时 ,只 有 归纳 的 概括 才 是 有 用 的 概括 ”的 思想 (中 译本 第 
21 页 )， 喜 入 林 (1987/1993， 171) 指 出 :向 ”( 即 价 ) 是 动词 跟 名 词 
性 成 分 发 生 句 法 .语义 联系 而 表现 出 来 的 一 种 性 质 , 它 表 征 着 动词 
在 一 个 句法 结构 中 所 能 关联 的 名 词性 成 分 的 数量 。 因 此 “向 ?是 
动词 的 组 合 功能 的 数量 化 : 能 和 一 个 名 词性 成 分 发 生 主 谓 或 述 宾 
关系 的 动词 叫 单 向 动词 ,能 和 两 个 名 词性 成 分 发 生 主 谓 或 述 宾 关 
系 的 动词 叫 双 向 动词 ,能 和 三 个 名 词性 成 分 发 生 主 谓 或 述 宾 关 系 
的 动词 是 三 向 动词 .。“ 向 ”的 基础 是 动词 在 句法 结构 中 跟 名 词性 成 
分 发 生 组 合 关 系 的 潜能 “向 ?是 一 种 建立 在 句法 基础 上 的 语法 范 
畴 ,是 动词 的 组 合 功能 的 数量 表征 。 圳 航 林 (1998) 进 一 步 指出 : 
因为 价 反映 了 动词 对 其 他 词 项 的 支配 能 力 , 具 有 不 同 的 支配 能 力 
的 动词 有 不 同 的 价 ;这 样 ,通过 对 不 同 的 动词 的 价 的 描写 就 可 以 对 
它们 的 句法 组 合 能 力作 出 简洁 的 刻画 。 也 就 是 说 , 价 反 映 了 动词 
的 某 种 分 布 状况 一 一 它 到 底 能 跟 多 少 . 哪 些 从 属 成 分 共 现 ; 或 者 
说 , 价 是 对 某 种 分 布 的 集约 化 的 表示 一 一 用 数字 来 反映 动词 能 跟 
多 少 从 属 成 分 共 现 。 如 此 看 来 ,研究 配 价 的 目的 在 于 更 好 地 说 明 
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句法 结构 的 合格 性 、 说 明 句 法 结构 跟 语 义 结构 的 关系 (第 87 页 ) 。 
在 这 样 的 认识 指导 下 ,我 们 从 一 定数 量 的 实际 语 料 中 归纳 、 总 结 各 
种 动词 的 配 价 情况 ,概括 出 它们 的 论 元 结构 ;然后 预测 ,在 其 他 语 
境 下 ,这 些 动词 跟 名 词性 成 分 的 组 配 情况 将 是 什么 情况 。 这 就 像 
是 词类 划分 一 样 , 根 据 一 定数 量 的 实际 语 料 , 归 纳 、 总 结 词 的 各 种 
分 布 情况 ,把 不 同 分 布 的 词 划 归 不 同 的 词类 ;然后 预测 ,这些 词 将 
各 有 什么 样 的 分 布 位 置 和 使 用 方式 。 从 方法 论 上 讲 , 这 是 一 种 基 
于 用 法 的 语法 模型 (usagebased modal of grammar) ,从 归纳 中 得 
到 一 般 性 的 概括 ,再 用 一 般 性 的 概括 来 解释 已 有 的 相关 现象 并 预测 
可 能 出 现 的 相关 现象 。 

上 面 这 种 思想 可 以 得 到 语言 习 得 方面 的 证 据 的 支持 ,Goldberg 
《1995) 指 出 :说 话 人 在 使 用 词汇 时 倾向 于 保守 。 火 们 通常 把 词汇 使 
用 于 同样 的 句 式 中 , 他 们 以 前 听 到 过 这 些 词 项 被 别人 用 到 这 些 句 式 
中 。 但 是 ,如 果 被 适当 地 启动 ,他 们 也 会 把 这 种 用 法 扩展 到 新 的 模型 
状 二 光束。 新 的 用 法 和 意义 是 通过 跟 既 有 的 例子 的 相似 性 而 获得 的 ， 
2 动词 的 小 类 是 由 说 话 人 内 在 地 、 隐 含 性 地 对 学 过 的 例子 进行 概 
括 而 得 出 的 。 因 为 记忆 是 联想 性 的 ,用 在 同样 句 式 中 的 类 似 的 动词 
通过 一 般 的 范畴 化 过 程 而 划 归 到 一 类 中 去 (p. 133 一 4) 。 总 而 言 之 ， 
通过 归纳 和 类 推 , 人 们 可 以 获得 关于 动词 和 名 式 之 间 互 动 关 系 的 全 
部 知识 。 


4.3 句 式 扩张 的 逻辑 机 制 : 归 因 推 理 和 动因 解释 


根据 上 文 的 讨论 ,每 一 种 句 式 都 有 一 组 惯用 的 动词 , 当 其 他 类 别 
的 动词 代入 这 种 动词 所 惯用 的 句 式 时 就 造成 了 名 式 套用 ,和 句 式 套用 
的 一 个 重要 的 语 用 动因 是 表达 的 精细 化 。 同 时 , 句 式 套用 的 一 个 直 
接 的 语法 后 果 是 句 式 扩张 ,这 至 少 包括 句 式 意义 的 引申 和 进入 句 式 
的 动词 类 别 的 增加 两 个 方面 。 那 么 , 句 式 扩张 的 逻辑 机 制 是 什么 呢 ? 
特别 是 $ 4. 1 中 所 说 的 : 句 式 跟 所 表达 的 事件 之 间 的 对 应 关系 是 有 
理据 的 ,但 又 是 不 可 预测 的 ,这 种 情况 到 底 是 否 符合 人 类 的 思维 规 


@ 基于 用 法 的 语法 模型 , 详 见 Goldberg (1995) ,p. 133 一 139，192，226 。 
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律 ? 或 者 说 人 脑 能 否 处 理 这 种 扑朔迷离 的 现象 ? 对 此 ,我们 尝试 从 
归 因 推理 和 动因 解释 的 角度 作出 一 些 说 明 。 

所 谓 归 因 (Cabduction) ,就 是 推出 最 好 的 解释 。 为 了 进行 归 因 ， 
大 们 必须 先知 道 结果 ,因此 , 归 因 推理 涉及 事后 推理 (after-therfact 
reasoning) ,用 以 决定 为 什么 一 连 串 特定 顺序 的 事件 是 按照 这 种 顺 
序 发 生 的 。 可 见 , 归 因 推 理 试图 推出 一 连 串 已 经 发 生 的 事件 之 所 
以 是 这 种 发 生 顺 序 的 动因 ,但 是 它 不 能 事先 预测 这 一 连 串 事件 的 
发 生 顺 序 。 这 跟 演 绎 (Cdeduction) 不 同 ,演绎 推理 追求 对 一 连 串 事 
件 的 发 生 顺 序 作出 预测 。 现 在 ,人 工 智 能 研究 领域 越 来 越 清 楚 地 
认识 到 寻找 动因 之 类 的 推理 (motivation-like reasoning) 的 重要 性 ， 
因为 人 类 的 许多 智能 行为 就 是 基于 通过 寻找 动因 之 类 的 推理 来 推 
出 最 好 的 解释 。 因 此 , 归 因 对 于 建立 人 类 自然 的 推理 模式 是 有 用 
的 。 这 一 点 对 于 以 模拟 人 类 自然 智能 为 目标 的 人 工 智 能 研究 来 
说 ,意义 十 分 重大 。 有 研究 表明 ,在 语言 运用 方面 人 们 广泛 地 使 用 
归 因 推理 。 比 如 ,尽管 说 话 人 不 能 预测 两 个 相关 的 概念 是 否 ` 或 多 
大 程度 上 会 在 形式 上 也 相关 ,但 是 ,为 了 使 这 种 输入 形式 有 意义 、 
从 而 把 这 种 新 形式 放 和 人 相关 格式 组 成 的 网 络 ( 这 构成 了 他 们 的 语 
言 知识 ) 中 ,他 们 还 是 要 寻找 这 种 关系 。 也 就 是 说 ,形式 与 意义 : 形 
式 一 意义 配对 之 间 的 关系 被 语言 使 用 者 (无 意识 地 ) 按 照 他 们 自己 
的 方式 观察 和 思考 。 显 然 , 如 果 这 种 说 法 是 正确 的 : 人 们 寻找 归 
因 解 释 ( 即 动因 ) 来 解释 事件 的 顺序 ,那么 ,我 们 有 理由 猜想 : 说 话 
人 也 许 无 意识 地 应 用 同样 的 原理 来 习 得 语言 对 于 特定 句 式 及 
其 句 式 意义 和 构成 成 分 及 其 词汇 意义 之 间 的 关系 来 说 ,语言 使 用 
者 倾向 于 先 验 地 认为 : 一 定 的 句 式 表示 一 定 的 句 式 意义 ,一 定 的 
名 式 意义 又 是 跟 一定 句 式 的 特定 构造 相关 的 ;名 式 中 各 个 构成 成 
分 及 其 结构 关系 对 句 式 的 整体 意义 都 有 贡献 ,一 定 的 构成 成 分 由 


力 ， 以 上 叙述 主要 按照 Goldberg (1995)B.71, 但 也 根据 笔者 的 知识 和 理解 作 了 引 
申 和 发 挥 。 把 abduction 译作 * 归 因 ”, 是 采纳 了 美国 Temple University 计算 机 系 王 培 教 
授 的 意见 ,他 在 第 三 届 国 际 认 知 科 学 大 会 (2001 年 8 月 27 一 31 日 ,北京 ) 期 间 ,鼓动 我 用 
归 因 推理 等 非 公 理 逻 辑 (Non-Axiomatic Logic) 的 办 法 处 理 自然 语言 , 谨 此 致谢 。 
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一 定 的 词汇 或 语法 范畴 来 实现 (或 者 说 句 式 中 的 特定 位 置 由 特定 
的 词汇 ` 语 法 范畴 来 填充 ) 。 这 样 , 就 把 句 式 意义 归结 为 特定 句 式 
的 整体 构造 和 构成 成 分 及 其 结构 关系 。 例 如 : 


(1) Pat handed Chris the ball. 
《2) Pat threw Chris the ball. 

〈3) Pat hit Chris the ball. 

(4) Pat shined Chris the ball. 


人 们 从 例 (1) 这 样 的 句子 上 推出 : 双 宾 句 的 谓语 动词 要 表示 传递 意 
义 , 以 便 能 够 联结 施 事 、 受 事 和 与 事 三 个 论 元 。 于 是 ,对 于 例 (2)(3) 
这 样 的 句子 也 乐意 接受 ;因为 动词 threw 和 hit 的 意义 不 仅 跟 hand 
等 动词 的 意义 不 相 冲突 ,并 且 可 以 解释 为 传递 意义 的 下 位 概念 一 一 
即 具体 地 指示 了 转 递 的 方式 。 更 进一步 ,居然 还 能 接受 例 (4) 这 样 的 
句子 ;当然 ,脑筋 得 多 转 几 个 弯 : 先 假定 例 (4) 是 合格 的 ,并 且 表达 了 
类 似 例 (1) 一 (3) 这 种 受 事 由 施 事 向 与 事 转移 的 传递 意义 ;再 在 传递 
这 种 句 式 意义 和 谓语 核心 shin( 肥 ) 的 词汇 意义 之 间 进 行 互 动 ,假定 
名 词 shin 所 表示 的 肢体 意义 不 仅 跟 传递 这 种 句 式 意义 不 矛盾 ,而 且 
能 够 整合 (integrate) 进 这 种 句 式 意义 之 中 ;于 是 ,把 在 双 宾 名 的 谓语 
核心 位 置 上 的 shin 的 意义 解释 为 通过 肥 的 动作 来 传递 ;最 终 , 达 到 
了 句子 的 形式 和 句子 的 意义 、 句 子 整体 意义 和 句子 成 分 的 意义 的 互 
相 协 调和 互相 可 以 解释 , 即 是 有 理 可 据 的 ` 具 有 动因 的 。 结 果 , 使 得 
双 宾 句 的 句 式 意义 得 到 进一步 的 引申 和 扩大 ,从 原来 表示 单纯 的 传 
递 到 后 来 表示 通过 某 种 特定 的 方式 来 传递 ,一 直到 表示 通过 某 个 特 
和 定 肢体 的 动作 来 传递 。 

更 有 甚 者 ,人 们 还 愿意 把 嵌 在 特定 句 式 中 的 生 造 出 来 的 词 也 解 
释 为 具有 跟 句 式 意 义 相 协调 的 词汇 意义 。 例 如 : 


《5) She gave him something. 
〈6) She topamased him something。 


Goldberg (1995: 35) 指 出 ,他 的 十 个 被 试 中 , 竟 有 六 个 人 认为 无 意义 
单词 Cnonsense word)topamase 的 意思 是 give。 
总 而 言 之 ,在 寻找 动因 和 最 好 的 解释 这 种 归 因 推理 的 逻辑 机 
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制 的 作用 下 , 填 人 特定 句 式 的 特定 位 置 的 词汇 类 别 增 加 了 , 随 之 而 
来 的 是 该 句 式 的 句 式 意 义 引申 和 扩大 了 。 据 些 , 归 因 推 理 可 以 看 
作 是 句 式 和 词汇 互动 的 一 种 逻辑 机 制 。 归 因 推 理 这 种 寻找 动因 解 
释 但 无 法 作出 预测 的 逻辑 机 制 , 正 好 适合 处 理 句 式 跟 所 表达 的 事 
件 之 间 的 对 应 关系 是 有 理据 的 .但 又 是 不 可 预测 的 这 种 语言 现象 。 
换 句 话说 , 句 式 跟 所 表达 的 事件 之 间 的 对 应 关系 是 有 理据 的 、 但 又 
是 不 可 预测 的 这 种 语言 现象 ,是 我 们 人 脑 的 思维 规律 所 允许 的 ,也 
是 能 处 理 的 。 


5 论 元 结构 和 句 式 结构 的 互动 : 
从 原理 走向 规则 


现在 ,大 概 多 数 语法 研究 者 都 能 同意 : 句 式 意义 主要 来 源 于 动 
词 的 论 元 结构 和 句 式 结构 的 交互 作用 (interaction) ;但 是 ,词汇 与 名 
式 的 交互 作用 只 是 一 个 基本 的 原理 ,我 们 应 该 把 这 种 抽象 的 原理 具 
体 化 为 可 以 落实 到 具体 的 操作 上 的 规则 。 比 如 ,我 们 上 文 多 次 讨论 
到 下 列 几 种 动词 变价 或 论 元 增生 的 句 式 ， 


C) a. 医 绚 死 了 父亲 


关于 这 种 句子 中 增加 的 动词 原来 的 论 元 结构 中 所 没有 的 受害 者 论 旨 
角色 (maleficiary role) , 潘 海 华 (1997) 认 为 : 在 汉语 语法 系统 中 ,有 
一 条 普遍 的 受害 者 择 人 规则 (general maleficiary role insertion rule， 
简称 MRD ,引发 了 把 受害 者 角色 加 入 相关 动词 的 论 元 结构 中 的 操 
作 。 控 制 这 条 规则 操作 的 语义 条 件 是 动词 的 意义 ,这 种 动词 要 求 带 
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有 某 种 不 好 的 效果 或 影响 (第 6 页 .第 15 页 注 7).@ 我 们 认为 ,受害 
者 插入 规则 可 以 推广 为 更 加 普遍 的 与 事 插 入 规则 (general dative 
role insertion rule, 简称 DRID ,从 而 把 $ 1. 2 中 的 受 惠 者 论 元 增 容 规 
则 和 目标 论 元 增 容 规则 也 概括 进来 。 控 制 这 条 与 事 插入 规则 操作 的 
语法 条 件 是 句 式 的 意义 : 当 句 式 义 涉 及 当 事 ( 包 括 受害 者 ) 和 客体 两 
个 论 元 角色 之 间 的 丧失 关系 ,而 相关 动词 只 有 客体 一 个 参与 角色 时 ; 
或 者 , 当 句 式 义 涉及 施 事 、 受 事 和 与 事 ( 包 括 受 惠 者 、 受 害 者 和 目标 
等 ) 三 个 论 元 角色 之 间 的 转移 关系 ,而 相关 动词 具有 施 事 和 受 事 两 个 
参与 角色 时 ;就 启动 与 事 插入 规则 ,在 相关 动词 的 论 元 结构 中 插入 了 
一 个 与 事 论 元 。 比 如 , 像 例 (1) 这 样 的 丧失 句 式 要 求 有 丧 失 的 主体 
《 即 受 害 者 ) 和 丧失 的 客体 两 个 论 元 角色 ,而 “ 死 `. 飞 . 烂 、 报 废 > 这 种 动 
词 原 有 的 论 元 结构 中 只 有 一 个 客体 论 元 ;于 是 ,在 丧失 句 式 的 丧失 意 
义 的 驱动 下 ,在 相关 动词 的 论 元 结构 中 临时 插入 了 一 个 受害 者 角色 。 
同样 ， 被 ”字句 通常 表示 不 如 意 的 遭受 等 意义 ; 当 述 宾 结 构 作 “被 ” 字 
名 的 谓语 核心 时 ,在 遭受 这 种 句 式 意义 的 驱动 下 ,在 相关 动词 的 论 元 
结构 中 临时 插入 了 一 个 受害 者 角色 。 再 如 ; 


Q@ 潘 海 华 (1997) 指 出 , 带 有 受害 者 插 人 的 动词 (或 者 说 得 广 一 点 儿 , 所 有 含有 论 旨 
角色 “受害 者 ”的 动词 ) 都 只 允许 受害 者 作 主 语 ,而 另 一 个 论 旨 和 角色“ 客体” 或 “ 受 事 ” 则 只 能 
成 为 所 谓 的 滞留 宾语 (retained object) 。 这 种 现象 也 包括 下 面 这 类 句子 ， 

〈1) 他 被 我 罚 了 五 块 钱 

(2) 他 被 我 踢 了 一 肝 

(3) 那 块 肉 被 我 炒 了 青椒 
他 在 词汇 映射 理论 的 框架 内 ,利用 受害 者 和 客体 / 受 事 在 论 则 层级 关系 (thematic role hi- 
erarchy, 简 称 TRH) 上 的 不 同位 置 ( 施 事 之 受益 者 /受害 者 之 接受 者 /经 验 者 之 工具 过客 
体 / 受 事 之 处 所 ) ,加 上 主语 条 件 及 其 相关 的 映射 规则 来 正确 地 预期 受害 者 、 而 不 是 客体 / 
受 事 , 作 被 动 句 的 主语 。 具 体 的 技术 细节 请 看 潘 海 华 (1997) ,第 6 一 ?7 页 。 但 是 ,如 果 考 虑 
到 下 列 例子 ,那么 潘 海 华 (1997)“ 只 允许 受害 者 作 主 语 ” 的 论断 就 必须 重新 检讨 ， 


(4) 李 铎 吃 了 小 
(5) 老 刘 抽 了 
(6) 小 芳 花 了 

如 果 其 中 的 与 事 论 元 的 论 旨 角 色 也 是 受害 者 ,那么 受害 者 角色 也 可 以 充当 间接 宾语 。 
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(3) a. 李 铎 吃 了 小 郡 一 个 苹果 
b. 玲玲 只 穿 过 姥姥 一 件 毛 衣 
c. 老 刘 抽 了 小 孙 一 支 香 烟 ， 
d. 小 芳 花 了 奶奶 一 百 块 钱 
e. 小 明 糟 踊 了 “我 ”好 几 张 宣纸 
a.。 王刚 扔 我 一 包 香 烟 
b. 小 平 塞 地 伟 一 个 纸 条 
c. 小 明 踢 小 华 一 个 针线 球 
d. 玉 芳 孝 故 公公 一 条 香烟 
单 及 物 动 词 “ 吃 、 扔 ” 原 有 的 论 元 结构 中 只 有 施 事 和 受 事 两 个 论 元 ,但 
是 ,在 双 及 物 句 式 的 获得 /给 予 意义 的 驱动 下 ,在 相关 动词 的 论 元 结 
构 中 临时 插 人 了 一 个 与 事 ( 受 害 者 或 受益 者 ) 角 色 。 这 样 , 使 得 动词 
的 论 元 结构 跟 句 式 的 论 元 结构 能 够 更 加 吻合 。 

我 们 希望 能 够 发 现 更 多 的 诸如 普遍 的 与 事 角 色 插 入 规则 、$ 3. 3 
中 讨论 的 施 事 删除 规则 和 广义 被 动 化 规则 等 改变 动词 的 论 元 结构 的 
规则 ,并 刻画 控制 这 种 规则 使 用 的 句法 .语义 条 件 , 从 而 使 词汇 与 句 
式 交 互 作 用 的 原理 更 加 具体 化 和 可 操作 化 。 


〈4) 


6 结语 : 一 个 简短 的 总 结 


8$ 1 指出 动词 配 价 学 说 和 论 元 结构 理论 的 核心 思想 是 词汇 主义 
和 动词 中 心 论 , 当 磁 到 动词 的 组 配 性 质 跟 句 式 构造 不 一 致 时 ,它们 分 
别 采 用 变价 和 论 元 增 容 规则 来 处 理 。 与 此 相对 的 是 句 式 语法 和 句 式 
配 价 的 思想 ,认为 配 价 是 句 式 的 属性 ` 句 式 具 有 指派 论 元 的 功能 、 句 
式 的 论 元 结构 是 由 句 式 意义 决定 的 。 

8 2 指出 基本 的 句 式 意义 是 由 名 式 所 惯用 的 典型 动词 的 论 元 结 
构 带 来 的 ,一 定 类 别 的 动词 有 其 惯用 的 句 式 。 为 了 表达 的 精细 化 等 
语 用 动机 , 甲 类 动词 可 以 有 条 件 地 套用 乙 类 动词 所 惯用 的 句 式 ; 这 造 
成 动词 的 论 元 结构 和 句 式 的 论 元 结构 不 一 致 ,还 造成 了 句 式 意 义 的 
引申 和 扩张 。 句 式 套用 和 词 项 代 人 是 动词 和 句 式 互动 的 一 种 具体 的 
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操作 机 制 。 

$3 指出 句 式 对 动词 有 严格 的 、 难 以 预测 的 选择 限制 ,这 造成 了 
句 式 的 不 完全 能 产 性 。 只 有 当 动 词 表示 的 事件 类 型 是 句 式 所 表示 的 
事件 类 型 的 一 个 直接 的 下 位 概念 .并 且 这 个 下 位 概念 是 基本 层次 范 
畴 时 ,才能 代入 这 种 句 式 。 代 入 某 种 句 式 的 非典 型 动词 跟 这 种 句 式 
有 两 种 磨合 方式 : 一 是 通过 词汇 化 手段 增加 新 的 义 项 ,从 而 产生 跟 
名 式 相 一 致 的 论 元 结构 ;二 是 通过 词汇 衍生 手段 ,在 不 改变 词义 的 情 
况 下 改变 动词 的 论 元 结构 。 

$4 指出 甲 类 动词 套用 乙 类 动词 所 惯用 的 句 式 的 认 知 基础 是 隐 
喻 投射 , 即 把 跟 乙 类 动词 及 其 惯用 名 式 所 表示 的 概念 结构 投射 到 甲 
类 动词 所 表示 的 事件 结构 上 ;从 而 把 两 种 事件 结构 合并 成 一 个 事件 
结构 ,包装 进 一 种 事件 图 式 中 ,并 形成 一 个 心理 完 形 。 以 归纳 动词 的 
句法 组 配 模 式 为 逻辑 起 点 ,可 以 超越 动词 配 价 和 句 式 构造 之 间 的 循 
环 论证 。 用 类 推 的 观念 ,可 以 解释 句 式 意义 的 引申 和 动词 类 别 的 扩 
展 。 指 出 追求 动因 解释 的 归 因 推理 是 句 式 扩张 的 逻辑 机 制 , 藉 此 可 
以 解释 句 式 与 所 表示 的 事件 在 对 应 关系 上 的 有 理据 性 和 不 可 预测 
人 性。 

$5 指出 应 该 概括 出 诸如 普遍 的 与 事 插 入 、 施 事 删除 .广义 被 动 
化 等 改变 动词 的 论 元 结构 的 规则 ,从 而 使 动词 与 句 式 互动 的 原理 具 
体 化 和 可 操作 化 。 

要 而 言 之 ,表达 的 精细 化 等 语 用 动机 促 动 了 句 式 套用 和 词 项 代 
入 ,这 又 引发 了 动词 和 句 式 的 互动 ,其 结果 是 动词 改变 其 论 元 结构 来 
适应 句 式 意义 和 句 式 构造 的 需要 。 在 一 定 的 句法 .语义 条 件 下 ;与 事 
插入 \ 施 事 删除 等 规则 作为 动词 和 名 式 互 动 的 具体 机 制 , 使 动词 衍生 
出 符合 句 式 要 求 的 论 元 结构 。 动 词 和 句 式 的 对 应 关系 是 有 理据 的 、 
但 又 是 不 可 预测 的 ,动词 和 句 式 互动 背后 的 逻辑 机 制 是 追求 动因 解 
释 的 归 因 推理 。 


鸣谢 : 本 文 先 后 承 顾 阳 、 郭 锐 等 学 长 指正 ,说 此 致 以 诚挚 的 谢 
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三 、 信 息 抽 取 和 
语义 标注 


信息 抽取 的 语义 知识 资源 研究 


本 文 讨论 支持 信息 抽取 的 语义 资源 的 建设 问题 ,举例 说 明了 信息 折 
取 至 少 需要 三 种 层面 的 语义 知识 : (i) 宏观 的 话语 篇 章 知 识 , 藉 此 可 以 
约束 信息 抽取 的 匹配 模板 的 类 型 ,预测 关键 性 的 信息 项 目 在 文本 中 的 分 
布 位 置 ;(ii) 中 观 的 论 元 结构 知识 , 藉 此 可 以 建立 动词 的 论 元 成 分 跟 事 
件 模 板 的 传递 与 继承 关系 ,帮助 确定 代词 或 空 语 类 跟 其 先行 语 的 回 指 关 
系 , 进 而 确定 其 语义 所 指 ;(iii) 微观 的 遇 辑 结构 知识 , 藉 此 可 以 确定 否定 
词 、 量 化 词 、 模 态 词 等 远 辑 算 子 跟 其 所 约束 的 成 分 之 间 的 远 辑 关系 ( 比 
如 ,哪些 成 分 处 于 否定 的 辖 域 之 中 ,其 中 哪个 成 分 是 否定 的 焦点 ,在 哪些 
语法 条 件 下 否定 词 是 宛 余 的 ,等 等 ) 。 最 后 ,指出 研究 这 三 种 语义 知识 所 
可 利用 的 几 种 理论 和 方法 。 


1 信息 抽取 和 语义 知识 资源 


信息 抽取 (information extraction, 简称 正 ) 指 用 计算 机 自动 地 
从 一 段 文本 (text) 中 抽取 出 指定 的 一 类 信息 (比如 ,事件 .事实 等 )， 
并 将 其 形成 结构 化 的 数据 填 人 一 个 数据 库 中 供用 户 查 询 和 使 用 的 
过 程 .9 例如 ,从 一 篇 关于 军事 演习 的 新 闻 报 道中 摘录 出 演习 的 类 
型 时间、 地 点 ` 兵 种 .武器 .装备 假想敌、 后 勤 保障 等 信息 。 随 着 
互联 网 的 普及 ,信息 抽取 成 了 从 网 上 自动 地 获取 自然 语言 文本 中 
特定 信息 的 一 种 非常 简捷 和 有 效 的 途径 ;相应 地 ,信息 抽取 技术 成 
了 计算 机 科学 和 计算 语言 学 中 的 一 门 具 有 良好 的 发 展 前 景 的 应 用 
技术 。 目 前 国外 从 事 信息 抽取 研究 主要 有 基于 知识 和 基于 统计 两 
种 方法 ,我 们 认为 单纯 地 用 基于 知识 的 模板 匹配 方法 或 者 单纯 地 
用 基于 数学 的 概率 统计 方法 都 是 有 缺陷 的 。 可 以 预期 ,把 这 两 种 
方法 结合 起 来 将 是 今后 研究 的 必然 趋势 ;但 是 ,怎样 把 这 两 种 方法 


@ 详 见 孙 斌 (2000) ,第 104 一 105 页 。 
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结合 起 来 ,一 时 还 不 容易 找到 可 行 的 交叉 点 。 我 们 从 语言 学 的 角 
度 构想 : 如 果 对 相当 数量 的 真实 文本 进行 语义 关系 标注 ,建立 一 
种 标 有 语义 关系 网 络 的 精炼 语料库 (简称 网 库 Cnaet-bank] ) 作 为 信 
息 抽 取 的 资源 ,那么 对 于 基于 知识 的 方法 来 说 ,这 种 网 库 将 提供 比 
脚本 和 框架 更 为 精细 的 语义 关系 网 络 , 有 利于 对 相关 信息 进行 比 
较 和 甄别 ,从 而 提高 信息 抽取 的 精度 。 对 于 基于 统计 的 方法 来 说 ， 
这 种 网 库 将 提供 一 种 语义 信息 十 分 丰富 的 训练 样本 ,可 以 通过 机 
器 学 习 的 方法 来 提高 信息 抽取 的 速度 。 

事实 上 ,研制 一 种 面向 信息 抽取 的 汉语 真实 文本 的 语义 标注 
系统 ,不 仅 能 为 汉语 文本 的 信息 自动 抽取 提供 可 靠 的 基础 和 充 
分 的 资源 ,而且 对 于 计算 机 信息 检索 、 自 动 文摘 、 信 息 理 解 、 文 本 
相似 度 的 自动 比较 乃至 语音 识别 “汉语 -外 语 ” 之 间 的 机 器 翻译 
等 自然 语言 信息 的 自动 处 理 ,提供 新 的 观念 ,方法 和 资源 ,从 而 
为 中 文 信息 处 理 技 术 的 产品 化 乃至 产业 化 ,从 语言 学 角度 作出 
新 的 贡献 。 

要 研制 这 种 网 库 ,首先 要 对 语义 标注 的 理论 和 方法 进行 研究 , 特 
别 是 要 研究 和 发 现 词 项 之 间 、 句 子 之 间 什 么 样 的 语义 关系 对 于 信息 
抽取 是 有 用 的 。 这 必 将 推动 我 们 去 检讨 已 有 的 各 种 语义 分 析 的 理论 
和 方法 的 效用 和 不 足 , 努 力 发 掘 新 的 .对 于 抽取 信息 有 用 的 语义 关 
系 ; 发展 新 的 语义 分 析 的 理论 和 方法 , 反 过 来 从 技术 应 用 的 角度 对 理 
论语 言 学 作出 贡献 。 


2 哪些 语义 知识 对 信息 抽取 是 重要 的 


为 了 真正 为 信息 抽取 提供 有 用 的 语义 知识 方面 的 资源 ,首先 必 
须 对 真实 文本 的 不 同 层 次 的 语义 关系 进行 分 析 和 辨别 。 围 绕 着 信息 
抽取 这 种 实用 的 目标 ,研究 下 列 问 题 : (1) 什么 样 的 语义 知识 对 从 
真实 文本 中 抽取 出 关键 性 的 指定 信息 是 有 用 的 、` 并 且 是 十 分 重要 的 
(2) 怎样 在 真实 文本 上 标注 这 些 语义 信息 ,并 且 使 计算 机 可 以 自动 
识别 和 作为 训练 样本 来 利用 。 由 于 篇 幅 的 限制 ,本 文 只 能 先 讨 论 第 
一 个 问题 。 
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我 们 通过 对 相当 数量 的 现代 汉语 真实 文本 的 分 析 , 发 现 以 下 这 
些 语义 知识 对 信息 抽取 是 至 关 重 要 的 : 话语 结构 、 篇 章 关系 、 论 元 结 
构 、 题 元 角色 :角色 转换 .照应 关系 、 和 否定 结 构 、 辖 域 歧 义 、 算 子 约束 关 
系 等 ,它们 可 以 归并 为 如 下 三 大 类 : 


2.1 宏观 层次 的 话语 一 篇 章 知 识 (discourse-text knowl- 
edge ) 


以 整个 篇 章 为 考察 单位 ,包括 文本 中 不 同 的 段落 和 小 节 甚 至 
句 群 和 句子 之 间 的 语义 关系 。 比 如 ,哪些 是 话题 名 (topic sentence) 
或 论点 名 ,哪些 是 支持 名 (support sentence) 或 论证 句 , 哪 些 是 背景 
名 (background sentence) ,哪些 是 总 结 句 (summary sentence) 或 结 
论 名 等 ;还 有 不 同 句 子 之 间 的 逻辑 语义 关系 ,比如 : 条 件 、 因 果 、 转 
折 等 偏 正 关系 或 并 列 、 对比 、 递 进 等 联合 关系 等 。 因 为 这 种 信息 对 
于 指导 计算 机 从 文本 的 哪些 地 方 、. 哪 些 句 子 中 抽取 信息 有 决定 性 
的 影响 。 比 如 ,我们 分 析 了 几 十 篇 关于 领导 人 出 访 或 会 见 .政府 更 
和 迭 等 的 通讯 报道 ,发 现 新 闻 这 种 文体 的 信息 分 布 是 有 很 强 的 规律 
的 ;往往 是 标题 或 第 一 句 话 ( 即 话题 句 ) 中 差不多 就 包含 了 全 部 重 
要 的 信息 项 目 。 现 在 以 新 华 通讯 社 2001 年 4 月 27 日 的 (每 日 电 
讯 》 为 例 : 

《1) 正 标题 : 江泽民 会 见 智利 参议 长 
副标题 :希望 新 世纪 中 智 友 好 关系 更 上 一 层 楼 
第 一 句 : 新 华 社 北 京 4 月 26 日 电 (记者 杨 国 强 ) 国 家 主席 
江泽民 今天 下 午 在 中 南海 会 见 智利 参议 长 安 德 烈 斯 。 萨 尔 迪 瓦 
时 说 ,智利 是 中 国 在 拉美 的 重要 合作 伙伴 。 
〈2) 正 标题 : 李瑞环 会 见 摩 海 哥 国 玉 
副标题 : 指出 中 国人 民 不 忘 非洲 “ 老 朋 友 ” 永 做 非洲 
“好 朋友 ?” 
第 一 句 : 新 华 社 非 斯 (摩洛哥 )4 月 26 日 电 ( 记 者 车 玉 明 、 范 
王 平 ) 摩 洛 哥 国 王 移 罕 菊 德 六 世 26 日 在 非 斯 王宫 和 中 国 宗 国 政 
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协 主 席 李 瑞 环 亲切 会 见 . 

(3) 正 标题 : 朱 镑 基 将 出 访 五 国 

第 一 句 : 新 华 社 北京 4 月 26 日 电 外 交 部 发 言 人 章 启 月 今 
天 下 午 在 记者 招待 会 上 宣布 : 应 巴基斯坦 …… 的 邀请 , 朱 匀 基 
总 理 将 于 5 月 11 日 至 22 日 对 上 述 五 国 进行 正式 访问 。 

(4) 正 标题 : 森 内 阁 宣 布 总 辞职 小 和泉 新 内 阔 组 成 

第 一 句 : 新 华 社 北京 4 月 26 日 电 ( 记 者 王 大 军 ) 日 本 森 喜 
朗 内 阔 26 日 上 午 在 最 后 一 次 临时 内 阁 会 议 上 宣布 总 什 职 ,新 的 
小 泉 新 内 阁 将 于 当天 晚间 成 立 。 


在 新 闻 报 道 的 标题 或 正文 第 一 句 ( 即 话题 句 ) 中 ,一般 首 先 要 交 
代 新 闻 的 六 要 素 , 即 : 时 间 (when)、 地 点 (where)\、 人 物 C(who) .事件 
(Cwhat) 、 原因 (why) 和 方式 (how) ,简称 6W, 从 而 赛 括 了 用 户 最 关心 
的 几 个 关键 性 的 信息 项 目 。 可 见 , 篇 章 结构 对 于 关键 性 的 信息 项 目 
的 分 布 有 很 强 的 预示 作用 。 

另外 ,文本 的 文体 (Cstyle) 类 型 方面 的 知识 ,对 于 信息 抽取 系统 
调用 匹配 模板 的 类 型 具有 约束 作用 。 比 如 , 像 新 闻 报 道 等 叙事 类 
Cnarrative) 文 体 ,一般 要 调用 包含 上 述 6W 的 模板 ;而 像 报刊 社论 、 
时 事 评论 等 议论 类 (argumentation) 文体 ,一 般 要 调用 包含 论点 ` 论 
据 、 结 论 等 的 模板 。 


2.2 中 观 层 次 的 论 元 结构 知 识 ( argument structure knowl- 
edge) 


基本 上 以 句子 为 考察 单位 ,包括 句子 中 的 谓词 (动词 和 形容 词 ) 
和 有 价 名 词 ( 一 价 名 词 和 二 价 名 词 ) 跟 其 从 属 成 分 之 间 的 支配 和 依存 


@ 这 里 “摩洛哥 国王 穆罕默德 六 世 26 日 在 非 斯 王宫 和 中 国 全 国政 协 主席 李瑞环 亲 
切 会 见 "一 句 , 严 格 地 说 是 不 合 语法 的 。 因 为 “会 见 是 一 个 比较 强 的 及 物 动 词 ,表示 施 事 
接见 受 事 , 这 受 事 一 般 不 能 表达 成 与 事 . 并 用 介词 引导 而 作 状 语 。 详 细 的 讨论 ,请 看 前 面 
《 论 元 结构 和 句 式 结构 互动 的 动因 、 机 制 和 条 件 》 一 文 的 8 1。 不 过 ,这 倒 从 反面 向 我 们 
提出 一 个 问题 : 在 真实 文本 中 ,可 能 会 出 现 一 些 不 太 符 合 一 般 的 语法 常规 的 表达 。 我 们 
在 做 动词 的 论 元 结构 研究 ,尤其 是 对 动词 及 其 支配 的 论 元 成 分 的 配 位 方式 进行 描写 时 , 怎 
样 照顾 到 这 种 情况 ,以 便 计算 机 对 真实 文本 作出 语义 关系 处 理 。 
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关系 ,可 以 通过 给 从 属 成 分 标定 论 旨 角 色 (thematic role) 的 方法 来 
体现 这 种 语义 关系 。 因 为 真实 文本 中 有 关 词 项 之 间 的 关系 主要 通过 
谓词 和 其 从 属 成 分 之 间 的 语义 关系 来 体现 的 ,谓词 及 其 论 元 之 间 的 
论 元 结构 关系 这 种 低层 次 的 语义 关系 最 终 可 以 通过 一 定 的 程序 传递 
到 高 层次 的 关于 事件 的 脚本 和 框架 结构 中 。 其 中 ,必须 着 重 研究 并 
罕 破 两 个 难题 : (i) 论 元 结构 这 种 低层 次 的 信息 跟 事件 脚本 或 框架 
这 种 高 层次 的 信息 之 间 的 传递 和 继承 关系 。 比 如 ,针对 简历 .生平 介 
绍 一 类 文本 的 信息 抽取 模板 ,必须 设立 出 生 \` 学 习 、 工 作 、 结 婚 ,. 去 世 
等 子 模板 ;于 是 在 相应 文本 中 诸如 “出 生 、 逝 世 、 就 学 .毕业 .工作 、 结 
婚 "一 类 动词 的 论 元 都 是 比较 重要 的 信息 ,是 信息 抽取 时 应 该 优先 考 
虑 的 对 象 , 并 最 终 将 成 为 填 人 模板 中 的 信息 项 目 。 例 如 : 


毛 庆 文 简历 
1898 年 阴历 11 月 1 日 出 生 于 浙江 省 江山 县 城 毛 民 大 家 。 
辛 记 革 命 后 ,她 先后 就 读 于 江山 西河 女 校 …… 南京 金陵 女子 大 
1929 年 秋 * 赴 美国 密歇根 大 学 留学 , 主 修 中 等 教学 行政 。 
1931 年 夏 获 硕士 学 位 后 …… 回 国 。 回 国 后 先后 执教 于 复旦 大 
学 、 暨 南大 学 。 
1935 年 2 月 9 日 与 前 国务 总 理 能 希 龄 结婚 ,并 主持 能 氏 创 
办 的 北京 香山 感 幼 院 。 
1949 年 4 月 到 台湾 ,1950 年 赴 美 国 。 先 后 就 职 于 旧金山 
“少年 中 国 报社 加 州 大 学 、 华 感 顿 大 学 。 
1962 年 回 台 湾 定 居 ，, 并 执教 于 实践 家 政 专科 学 校 ,1966 年 
退休 。 现 居于 台北 内 湖 。 
G《 中 华 读 书 报 》,2000 年 10 月 11 日 ,第 5 版 ) 
像 上 文中 动词 出生? 的 主事 论 元 “ 毛 彦 文 ”时 间 论 元 “1898 年 阴历 
11 月 工 日 、 处 所 论 元 “浙江 省 江山 县 城 毛 氏 大 家 ”“ 就 读 ” 的 处 所 论 
元 “江山 西河 女 校 …… ee 
被 抽取 出 来 的 信息 项 目 。(ii) 所 指 相同 的 名 词性 成 分 的 论 旨 角色 的 
| 消 类 的 所 指 的 影响 和 作用 。 因 为 所 指 


238 基于 认 知 的 汉语 计算 语言 学 研究 


相同 的 名 词性 成 分 对 于 同一 个 句子 中 、 前 后 相 邻 的 句子 中 的 不 同 动 
词 而 言 ,其 论 旨 角色 可 能 是 相同 的 、 也 可 能 是 和 不同 的 ;这 种 论 旨 和 角色 
的 保持 或 转变 对 于 句子 中 代词 或 空 语 类 的 所 指 和 照应 关系 是 有 预测 
作用 的 .O ,因此 对 于 信息 抽取 来 说 ,这 种 信息 是 比较 关键 和 重要 的 。 
例如 ; 
(5) 澳门 报刊 ; 近来 纷纷 发 表 评 论 ,[ei] 谴 责 美 国 对 台 出 售 
先进 武器 , [ei] 奉 劝 美国 政府 在 对 台 军 售 问题 上 崖 勒 马 。 
(《 每 日 电讯 》,2001 年 4 月 27 日 ) 
(6) 秘鲁 《 秘 华商 报 洲 25 日 发 表 评 论 ,[ei] 严 厉 批 评 美 国政 
府 j[ei] 不 顾 中 国政 府 的 强烈 反对 和 严正 交涉 ,[e] 公 然 向 台湾 
出 售 先进 武器 。( 同 上 ) 
(7) 中 国 国 家 主席 江泽民 ; 今天 致电 俄罗斯 总 统 普 京 j,[ei] 
[向 6] 祝 贺 俄 罗斯 国庆 节 。((《 人 民 日 报 为 2001 年 6 月 13 日 ， 
第 工 版 ) 
(8) 日 前 ,云南 省 委 宣传 部 、 省 科技 厅 ; 组 织 10 名 优秀 中 青 
年 学 术 带 头 人 i 召 开 了 “ [eri] 纪 念 建党 80 周年 ,ECei+i] 共 话 科 教 
兴国 ”的 座谈 会 。( 同 上 ) 
(9) 巴西 联邦 警察 二 十 五 日 上 午 将 在 哥伦比亚 被 捕 的 巴西 
大 毒 泉 费 尔 迪 尼 奥 押解 回 巴西 利 亚 , 并 暂时 关押 在 联邦 警察 局 
的 牢房 里 。( 同 5) 


在 例 (5) 中 ,两 个 后 续 小 名 的 空 主 语 承 先 行 小 句 的 主语 而 省 略 , 论 元 
角色 保持 不 变 ,都 是 施 事 。 在 例 (6) 中 ,第 二 个 小 名 的 空 主 语 承 先 行 
小 句 的 主语 而 省 略 , 论 元 角色 保持 不 变 , 都 是 施 事 ; 第 二 个 小 句 中 后 
续 动 词 “ 不 顾 ? 的 施 事主 语 和 第 三 个 小 名 的 主语 跟 先 行动 词 “ 批 评 ” 的 
受 事 宾语 同 指 , 被 强制 性 地 删除 了 。 例 (7) 第 二 个 小 句 除 了 承 先 行 小 
名 而 省 略 施 事主 语 之 外 ,还 承 先行 小 句 的 与 事 宾 语 而 省 略 了 状语 位 
置 上 的 与 事 及 其 介词 。 例 (8) 总 体 上 是 连 谓 结 构 作 谓语 的 主 谓 结 构 ， 


@ 这 一 点 是 董 振东 先生 在 “信息 处 理 用 现代 汉语 词汇 研究 》 课 题 组 研讨 会 "1998 
年 12 月 22 一 24 日 ,北京 ) 期 间 提 醒 我 注意 的 ,说 此 致 以 诚挚 的 谢意 。 
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在 连 谓 结构 的 后 段 的 动词 “召开 ”的 宾语 中 ,有 一 个 由 两 个 述 宾 结 构 
组 成 的 并 列 结构 ;其 中 的 动词 的 协同 性 施 事 正 是 前 段 动词 “组 织 ” 的 
施 事主 语 和 受 事 宾语 的 复合 体 , 即 “云南 省 委 宣传 部 .省 科技 厅 ” 和 
“10 名 优秀 中 青年 学 术 带头 人 ”; 并 且 , 由 于 结构 的 原因 ,这 种 协同 性 
施 事 只 能 以 空 主语 的 形式 出 现 。 例 (9) 则 说 明 要 快速 而 有 效 地 抽取 
信息 ,还 应 该 研究 “押解 回 , 关 押 在 ”等 “V- 回 .V- 在 ”类 动词 性 结构 的 
论 元 结构 。 


2.3 微观 层次 的 轩 辑 结构 知识 (logic structure knowledge) 


这 基本 上 也 是 以 句子 为 考察 单位 的 。 一 般 地 说 ,句子 的 逻辑 结 
构 涉 及 到 和 否定 性 词语 Cnegative word)、 量 化 词语 (quantifier) 模 态 
词语 (modal word) ,以 及 时 体 (tense，aspect) 成 分 跟 其 所 约束 的 成 
分 之 间 的 语义 关系 。 下 面 , 我 们 以 否定 关系 为 例 进行 讨论 。 

根据 我 们 的 考察 ,否定 性 词语 对 于 确定 文本 中 的 事件 到 底 发 生 
与 否 和 是 非 评 价 有 决定 性 的 影响 ,特别 是 否定 词 的 辖 域 (scope of 
negation) 到 底 管 到 哪儿 、 落 入 否定 辖 域 中 的 哪些 成 分 有 可 能 成 为 否 
定 词 的 否定 焦点 (focus of negation) 等 ,这 些 因素 对 于 信息 抽取 也 是 
具有 决定 性 的 影响 的 。 例 如 


《10) 德国 重申 不 参与 售 台 ( 湾 ) 武 器 。 
Cl11) 我 不 在 餐桌 上 批评 孩子 ,以 免 大 家 消化 不 良 。(《( 中 华 
.读书 报 》2001 年 3 月 14 日 ,第 4 版 ) 
《12) 他 虽 未 声称 ,如 果 没 有 IBM 大 属 杀 就 不 会 发 生 ,但 指 
出 受害 者 数目 却 由 于 IBM 当时 最 好 的 技术 而 大 为 增加 。(《 中 
华 读 书 报 》2001 年 3 月 28 日 ,第 13 版 ) 
[背景 : 布 菜 克 在 (IBM 和 大 必 杀 》(IBM and the Holocaust) 中 
写 道 ,纳粹 迫害 犹太 人 的 各 方面 ,无 论 是 在 人 口 善 查 中 鉴定 犹太 
人 ,还 是 在 欧洲 沦陷 区 管理 苦 役 集中 营 , 其 速度 提高 都 得 益 于 
IBM 穿孔 卡片 分 类 器 的 运用 。( 出 处 同上 ) 
像 倒 (10)(11) 中 的 “不 ” 例 (12) 中 的 “未 ”是 信息 抽取 时 不 能 丢掉 的 ， 
否则 将 得 到 跟 原文 相反 的 意义 。 在 例 (11) 中 ,虽然 “在 餐桌 上 批评 孩 
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子 ” 都 落 入 “不 ”的 否定 辖 域 之 中 ,但 是 只 有 作 状 语 的 焦点 成 分 “在 餐 
桌 上 ”是 真正 被 否定 掉 的 ,而 中 心 语 “ 批 评 孩 子 ” 的 意义 则 保持 下 来 
了 。 也 就 是 说 , 例 (12) 的 真正 意思 是 : { 我 批评 孩子 ,但 不 在 餐桌 上 
做 这 种 事 } 。 例 (10) 中 假设 性 的 双重 否定 名 “如 果 没 有 IBM 大 屠杀 
就 不 会 发 生 ”, 基 本 上 等 同 于 “ 正 是 有 了 IBM, 大 屠杀 才 会 发 生 的 ”。 
要 正确 地 做 到 这 种 同 义 互 释 (paraphrase) ,首先 必须 研究 “如 果 ……: 
就 …… ”格式 可 以 表示 假设 和 反 事 实 (counterfactual) 的 特点 ,研究 
“ 流 有 富 0 ”等 双重 否定 格式 的 语义 表达 功能 。 
汉语 中 有 大 量 的 由 一 连 串 小 句 (clause) 组 成 的 流水 名 (paratac- 
tic sentences) ,出 现在 先行 小 句 中 的 否定 词 到 底 管辖 不 管辖 后 续 小 
名 有 时 是 两 可 的 。 例 如 : 
(13) 这 种 类 型 的 视 感 觉 不 像 三 色 说 所 讲 的 ,是 由 于 不 同 闫 
色 混 合 的 结果 。 
(感觉 世界 》 中 译本 ,第 69 页 ) 
(14) 在 我 们 看 来 ,文革 并 不 像 林 笛 生 、 陈 来 教授 说 的 那样 ， 
[是 “五 四 ? 反 传 统 思想 的 继续 和 发 展 ] ,恰恰 相反 ,文革 是 五 四 ” 
对 立 面 成 分 的 回潮 ，…… 
(人 《北大 中 文 研究 》 创 刊 号 ,第 17 一 18 页 ) 
(15) 吕 先 生 和 许多 严肃 的 学 者 一 样 ,不 喜欢 随便 上 别人 家 
去 串门 ,[ 把 宝贵 的 时 间 虚 括 在 无 谓 的 清谈 之 中 。] 
(人 《中 国语 文 涪 998 年 第 3 期 ,第 167 页 ) 
《16) 吕 先 生 和 许多 严肃 的 学 者 一 样 ,不 喜欢 随便 上 别人 家 
去 串门 ,5 把 宝 责 的 时 间 都 用 在 读书 和 做 学 问 上 。] 


单纯 从 结构 上 看 , 例 (13) 一 (16) 的 后 续 小 句 既 可 以 解释 为 在 先行 小 
句 的 香 定 词 “ 不 ”的 辖 域 之 中 ,又 可 以 解释 为 在 “不 ”的 辖 域 之 外 。 从 
汉语 的 行文 习惯 上 看 “…… 不 像 …… 一 类 比 况 句 的 后 续 小 句 通常 
是 落 在 “不 ”的 辖 域 之 中 的 , 例 (14) 恰恰 相反 ”后 的 一 句 话 证 明了 这 
一 点 ;至 于 其 他 句 式 就 只 能 全 任 上 下 文 来 消除 否定 词 的 辖 域 歧义 了 ， 
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比如 例 (15) 和 (16) 的 情况 正好 相反 。@ 这 种 情况 将 给 计算 机 从 后 续 
句 中 抽取 信息 带 来 困扰 。 

一 般 地 说 ,有 无 否定 词 会 造成 句子 在 语义 表达 上 的 肯定 和 否定 
的 对 立 。 但 是 ,在 某 些 句法 环境 之 下 ,否定 词 似乎 是 宛 余 的 (redun- 
dant), 即 否定 词 在 语义 功能 上 被 某 些 特定 的 语法 环境 中 和 化 Cneu- 
tralization) 了 。 例 如 : 


《17) 在 没有 结婚 之 前 ,他 对 我 是 非常 体贴 的 。 
(18) 桐 桐 和 地 妈妈 在 没有 下 雨 之 前 已 经 回去 了 。( 笔 者 亲 
闻 ) 
对 于 “在 没有 …… 之 前 ”这 类 和 否定 句 ,在 信息 抽取 时 几乎 可 以 不 理会 
其 中 的 否定 词 “ 没 有 ”。 但 是 ,在 有 些 句 式 中 ,否定 词 到 底 影 响 不 影响 
句子 意义 的 肯定 或 否定 表达 , 则 取决 于 较为 复杂 的 语 用 因素 。 例 如 : 


(19) a。 受 联 队 差 点 儿 赢 了 这 场 球赛 ( 意 为 ; 没 赢 ) 
b。 受 联 队 差 点 儿 没 赢 了 这 场 球赛 ( 意 为 ; 误 了 /? 没 
赢 ) 
(20) a。 曼联 队 差 点 儿 输 了 这 场 球赛 ( 意 为 : 没 输 ) 
b， 受 联 队 差 上 儿 没 输 了 这 场 球赛 ( 意 为 : 输 了 / 没 输 ) 


从 语义 功能 上 看 “差点 儿 ? 相 当 于 一 个 否定 词 , 所 以 ,用 在 肯定 句 中 ， 
整个 句子 的 意思 是 否定 的 ,如 例 ([19) 和 (20) 的 a 句 所 示 ; 用 在 否定 名 
中 ,整个 句子 的 意思 是 肯定 的 ,如 例 (19) 和 (20) 的 b 句 所 示 。 同 时 ， 
例 (19) 和 (20) 的 b 句 还 有 一 种 否定 的 释义 , 即 “ 差 点 儿 十 没 十 VP” 是 
一 种 歧义 格式 ;至 于 它 到 底 表示 肯定 意义 还 是 否定 意义 ,在 很 大 程度 
上 取决 于 说 话 人 的 期 望 : 当 他 希望 VP 所 表示 的 事件 发 生 时 ,差点 
儿 十 没 十 VP”? 表 示 肯 定 意 义 ; 当 他 不 希望 VP 所 表示 的 事件 发 生 时 ， 
“ 关 点 儿 十 没 十 VP? 表 示 和 理 定 意 义 , 这 时 否定 词 “ 没 ”基本 上 是 宛 余 
的 .@ 这 种 否定 句 的 复杂 情形 ,给 信息 抽取 带 来 了 莫大 的 困扰 。 

我 们 相信 ,一 个 较 大 规模 的 .标注 了 上 述 三 种 语义 关系 的 语料库 


@ 详细 的 情况 ,请 看 袁 钞 林 (2000) 。 
@ 详细 的 情况 ,请 看 朱德 跟 (1980) 8 3. 2。 
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《 即 网 库 ) ,对 于 信息 抽取 工作 是 十 分 有 用 的 ,不 管 它 是 用 基于 (语言 
学 ) 规 则 的 方法 还 是 用 基于 统计 的 方法 。 


3 下 一 步 工 作 的 方案 和 思路 


上 文 讨论 了 哪些 语义 知识 对 信息 抽取 是 重要 的 ,现在 我 们 简要 
地 说 明 下 一 步 怎 样 来 研究 这 些 语义 知识 ,以 及 怎样 来 实施 这 些 工 作 。 


3.1 工作 方案 


由 于 这 种 课题 主要 研究 怎样 为 信息 抽取 提供 语义 知识 方面 的 资 
源 , 因 而 所 选 的 汉语 文本 最 好 已 经 有 了 初步 的 语法 标注 (包括 分 词 、 
词类 标注 甚至 短语 边界 等 信息 ) 。 为 此 ,我 们 打算 从 北京 大 学 计算 
语言 学 研究 所 加 工 出 来 的 1998 年 4 人 民 上 日 报 》 语 料 ( 已 经 完成 了 词语 
切 分 .词类 标注 和 专 名 处 理 ) 中 ,选择 诸如 “职务 调动 .产品 发 布 个 人 
简历 .自然 灾害 .新 型 材料 企业 重组 、 投 资方 向 ` 消 费 结 构 、 旅 游 经 
济 ` 假 日 消费 公费 医疗 .休闲 方式 ”等 几 十 个 专题 的 文本 ,进行 篇 章 
关系 、. 题 元 角色 .角色 转换 、 照 应 关系 、 和 否定 关系 等 语义 信息 的 标注 ， 
并 研究 这 些 标注 内 容 怎样 有 效 地 为 信息 抽取 提供 语义 知识 方面 的 支 
持 。 


3.2 “研究 思路 和 方法 


由 于 这 种 课题 主要 研究 怎样 通过 对 真实 的 汉语 文本 进行 语义 标 
注 , 来 为 计算 机 自动 地 从 汉语 文本 中 抽取 出 指定 信息 提供 语义 知识 
方面 的 资源 ;因而 在 对 语义 知识 的 揭示 表达 和 组 织 等 各 个 环节 上 ， 
都 需要 有 合理 并 且 可 以 形式 化 的 语义 学 理论 和 访 法 作 支撑 。 为 此 ， 
我 们 打算 首先 采用 话语 分 析 (discourse analyses) 和 篇 章 语言 学 (text 
linguistics) 的 理论 和 方法 ,结合 传统 语法 中 的 复句 研究 和 汉语 句 群 
研究 的 成 果 ; 对 同一 个 句子 中 不 同 的 小 句 、` 同 一句 群 中 的 不 同 句 子 之 
间 的 语义 关系 进行 分 析 ,着 重 找 出 相应 的 语法 形式 标志 。 用 确定 中 
心理 论 CCentering Theory) 来 研究 语 流 中 不 同 句子 的 注意 焦点 (fo- 
cus of attention ) 的 变化 (包括 继续 、 保 存 和 转变 ) 及 其 追踪 机 制 
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tracking mechanism) 和 不 同 的 话语 片断 中 小 话题 (diseourse Seg- 
ment topic) 的 转变 机 制 。 接 着 用 依存 语法 (dependent grammar) 和 
配 价 语法 (valence grammar) 的 思想 来 发 现 谓词 性 成 分 (包括 有 价 名 
词 ) 及 其 从 属 成 分 之 间 的 依存 关系 ,并 确定 不 同 的 谓词 性 成 分 的 价 
数 ; 用 格 语法 (case grammar) 和 论 元 结构 理论 (argument structure 
theory) 来 确定 这 些 从 属 成 分 的 论 旨 角色 及 其 句法 配置 方式 ;并 用 杠 
架 语 义学 (frame semantics) 中 “框架 一 槽 的 形式 表示 出 来 。 然 后 用 
档案 卡 更 新 语义 学 (file change semantics) 和 篇 章 表示 理论 (dis- 
course representation theory) 来 分 析 所 指 相 同 的 名 词性 成 分 对 于 不 
同 的 谓词 其 论 则 角色 的 保持 或 转变 ,确定 无 定名 词 短 语 (indefinite 
NP) 的 语义 所 指 ,代词 和 空 语 类 跟 先 行 词 的 照应 关系 及 其 语义 解释 。 
最 后 用 形式 语义 学 (formal semantics) 关于 否定 句 的 三 分 结构 (tri- 
partite structure) 的 理论 来 刻画 否定 句 的 语义 结构 ,分 析 和 否定 的 辖 域 
和 焦点 对 于 信息 抽取 的 影响 ;用 数理 逻辑 (mathematical logic) 和 生 
成 语法 (generative grammar) 中 的 量化 理论 (quantification theory) 
来 分 析 带 量化 词 的 结构 ,用 模 态 逻 辑 (modal logic) 和 时 间 逮 辑 (time 
logic) 来 分 析 句 子 的 模 态 和 时 体 。 
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用 动词 的 论 元 结构 
跟 事 件 模板 相 匹配 


一 一 一 种 由 动词 驱动 的 信息 抽取 方法 


本 文 以 孙 斌 (2000) 信 息 抽 取 模 型 (InfoX) 的 测试 语 料 ( 职 务 变动 文本 ) 
为 主要 对 象 , 具 体 说 明 怎 样 建立 从 动词 的 论 元 结构 到 相关 的 事件 模板 的 
匹配 关系 。 首 先 根 据 职务 变更 动词 的 有 关 向 法 、 语 义 特 点 ,把 它 分 成 六 个 
小 类 : 任命 ,担任 免职、 什 职 调遣、 受命 ;然后 ,分 别 描写 每 一 小 类 动词 的 
论 元 结构 ,特别 是 它们 所 支配 的 论 元 角色 及 其 句法 配置 方式 。 最 后 ,建立 
动词 的 论 元 角色 跟 事 件 模板 元 素 的 匹配 关系 ,并 揭示 动词 对 文本 筛选 和 
合并 都 有 导向 作用 ,说 明 发 展 由 动词 驱动 的 信息 抽取 方法 的 可 行 性 。 


1 信息 抽取 模板 和 动词 的 论 元 结构 


在 信息 抽取 (information extraction ,简称 IE) 系 统 中 ,信息 抽取 
模板 起 到 把 要 提取 的 信息 内 容 类 型 化 和 结构 化 的 作用 。 比 如 ,用 户 
所 关心 的 一 个 任职 事件 中 的 四 个 信息 项 目 : 谁 . 什 么 时 候 、 什 么 组 
织 . 什 么 职务 ,可 以 表示 为 任职 模板 中 的 四 个 模板 元 素 (template 
elements) 。 这 样 , 跟 某 种 特定 事件 相关 的 模板 就 是 一 个 事件 模板 ， 
模板 中 的 槽 (slots) 就 是 事件 的 参与 者 (participants)。 如 果 把 一 个 事 
件 模板 看 作 是 一 个 句子 的 语义 的 某 种 抽象 化 表示 ,那么 模板 元 素 之 
间 的 关系 就 是 动词 的 及 物性 关系 意义 (transitivity), 各 个 模板 元 素 
就 是 动词 所 支配 的 论 元 Cargument)。 因 此 , 袁 航 林 (2002) 指 出 : 动 
词 的 论 元 结构 可 以 传递 到 事件 脚本 或 框架 中 ,动词 的 论 元 最 终 将 成 
为 填 人 事件 模板 中 的 信息 项 目 (第 10 页 ) 。 

本 文 以 孙 斌 (2000) 应 用 实例 “职务 变动 (succession)” 的 测试 语 
料 为 主要 对 象 ,具体 说 明 怎 样 建立 从 动词 的 论 元 结构 到 相关 的 事件 
模板 的 匹配 关系 。 
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2 职务 变动 文本 中 动词 的 类 型 和 特征 


孙 斌 (2000) 选 取 北 京 大 学 计算 语言 学 研究 所 加 工 出 来 的 1998 
年 6 人 民 上 日报》 语 料 , 对 他 设计 的 信息 抽取 模型 (InfoX) 进 行 测试 。 这 
是 一 种 已 经 完成 了 分 词 .词类 标注 和 专 名 处 理 的 语 料 。 他 通过 人 工 
阅读 头 两 个 月 的 语 料 ( 约 17.5MB 文本 ), 从 中 找 出 70 多 个 职务 变动 
事件 ,其 中 “任职 245 个 ,离职 ”16 个 ,调职 "11 个。 召回 率 ( 正 确 数 
目 除 以 实际 数目 ) 为 45% ,基本 达到 其 设计 目标 。 

我 们 对 这 些 测 试 语 料 (47 个 文本 ) 重 新 进行 了 分 析 , 发 现 其 中 实 
际 出 现 了 81 个 职务 变动 事件 ,每 一 个 事件 都 由 一 个 动词 及 其 从 属 成 
分 来 表达 。 为 了 方便 ,这 种 表示 职务 变动 的 动词 可 以 叫 作 “职务 变更 
动词 >, 相 应 地 ,表示 任职 的 动词 是 “任职 动词 ,表示 离职 的 动词 是 
“离职 动词 ? ,表示 调 职 的 动词 是 “调职 动词 >。 下 面 是 这 种 动 词 的 类 
型 (type) 及 其 实例 (token) ,括号 中 的 数字 表示 使 用 的 次 数 : 

(1) 任职 动词 , 共 19 十 2 个 ,分 为 “任命 和”* 担 任 ? 两 类 : 

A. 任命 动词 : 任命 (10) 、. 选 (2) .选举 (2)、 提 名 (1)、 选 聘 (1) 

B. 担任 动词 : 任 (18) .担任 (10)、 就 任 (1) .出 任 (2)、 上 任 (1)、 
现任 (1)、. 连 任 (2)、 历 任 (1) .兼任 (1)、 就 职 (3)、 当 (2)、 当 选 [为 ](6)， 
接任 、 继 任 

(2) 离职 动词 , 共 2 十 8 个 ,分 为 “免职 "和 ”辞职 ?两 类 : 

A. 免职 动词 : 免 去 撤销 、 撤 消 、 撤 除 、 解 除 、 罢 免 、 免 职 、 撤 职 

B. 辞职 动词 : 十 去 (3)、 什 职 (2), 离 任 \ 下台、 任 满 

《3) 调职 动词 , 共 3 十 1 个 ,分 为 “调遣 > 和 ”受命 "两 类 : 

A. 调 遗 动词 : 调 [ 动 ] …'…… 任 …… 、 升 [为 ](1)、 提 升 [ 为 ](1) 

B. 受命 动词 : 调任 (3) 

可 见 , 描 述职 务 变动 的 动词 之 数量 是 有 限 的 , 孙 斌 (2000) 只 涉及 
到 24 个 。 我 们 在 网 上 搜索 了 大 量 的 职务 变动 文本 ,补充 了 11 个 (后 
面 没 有 使 用 次 数 的 ) 。 这 样 ,总 共 才 35 个 。 更 为 重要 的 是 ,这 些 动词 
不 仅 可 以 分 成 任职 .离职 和 调职 三 类 ;而 且 , 每 一 类 下 面 都 可 以 分 成 
对 称 的 使 动 和 自动 两 类 : 任命 一 担任 .免职 一 辞职 .调遣 一 受命 。 于 
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是 ,这 六 类 动词 便 只 有 两 套 句法 上 的 组 配 模式 ( 详 见 下 一 节 ) ,为 信息 
抽取 提供 了 简明 扼要 的 语言 表达 模式 。 另 外 ,这 三 大 类 、 六 小 类 动词 
又 是 由 有 限 的 几 个 语素 组 成 的 。 比 如 ,任命 动词 主要 用 “ 选 ” 担 任 动 
词 主要 用 “ 任 ”、 免 职 动词 主要 用 “ 免 、 撤 ”\ 辞 职 动词 主要 用 “ 辞 ”\ 调 职 
动词 主要 用 “ 调 ”。 并 且 , 这 些 语素 都 是 独立 用 一 个 汉字 来 书写 的 , 辩 
识 起 来 十 分 容易 。 这 些 因素 都 非常 有 利于 实行 由 动词 驱动 的 信息 抽 
取 的 路 线 。 

最 后 ,我 们 发 现 孙 斌 (2000) 的 文本 中 还 用 了 比较 抽象 的 “成 C 了 ] 
(1) \ 成 为 (3)、 是 (4)?" 来 表达 担任 行为 ,用 终止 动词 “退休 (1)、 病 逝 
(1)” 来 隐 含 离职 行为 。 这 种 非 专用 的 职务 变更 动词 只 占 10/81。 也 
就 是 说 ,专用 的 职务 变更 动词 占 70/81(80% 弱 )。 对 于 非 专用 的 职 
务 变 更 动词 ,需要 在 篇 章 中 依赖 上 下 文 语 境 来 帮助 推导 。 这 些 问题 ， 
我 们 将 有 另 文 讨论 。 


3 职务 变更 动词 的 论 元 结构 


一 般 来 说 ,动词 的 论 元 结构 包括 动词 的 论 元 属性 (可 以 带 多 少 论 
元 , 即 配 价 数目 ). 论 旨 属 性 (这 些 论 元 跟 动 词 的 语义 关系 , 即 语义 
格 ) .范畴 属性 (这 些 论 元 分 别 由 什么 词类 来 实现 ) 句法 属性 (这 些 论 
元 分 别 充当 什么 句法 成 分 ). 语 义 属性 (实现 这 些 论 元 的 词语 有 什么 
语义 特征 ) 句法 配置 (动词 跟 其 论 元 可 以 构成 哪些 句法 格式 )。 对 
此 ,下 面 采用 诸 动词 共有 的 合 叙 , 殊 异 的 分 述 这 种 权宜 的 ` 节 省 篇 幅 
的 体例 。 

职务 变更 动词 一 般 带 有 系 事 (relative, 记 作 Re) 和 经 事 (experi- 
encer, 记 作 Ex) 两 种 论 元 角色 ,分别 表 示 某 种 职务 和 担任 或 辞去 这 
种 职务 的 人 ;有 的 还 带 有 施 事 (agent, 记 作 A) , 指 实施 任命 或 解除 这 
种 职务 的 人 或 组 织 .9 例如 : 


C1) [ 周 小 川 ] 世 出 任 [ 中 国人 民 银 行 行 长 ]ge。 (南方 网 ) 


四 ”为 了 方便 ,动词 的 论 元 的 论 旨 角色 简称 论 元 角色 。 关 于 论 元 角色 的 类 型 及 其 句 
法 .语义 特征 , 详 见 圳 入 林 (2002b,2003)。 
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(2) [张云川 ]e. 侠 去 [湖南 省 长 职务 ]ge。( 南 方 网 ) 

K3 [中 央 军 委 ]^ 任 命 [ 孔 英 je 为 [陕西 省 军区 政委 je。 
〈 南 方 网 ) 

(6) [中 共和 免 去 [ 张 文 康 ]se[ 卫 生 部 党 组 书记 职务 ]e。 
(南方 网 ) 


其 中 , 施 事 A 由 名 词性 成 分 充当 ,其 语义 特征 (约束 条 件 ) 是 指 人 或 
组 织 ( 记 作 NPL 十 human / organization ]) ,其 句法 属性 是 一 般 作 主 
语 ; 经 事 Ex 由 名 词性 成 分 充当 ,其 语义 特征 是 指 人 ( 记 作 NPL 十 hu- 
man]) ,其 句法 属性 是 一 般 作 宾语 (在 施 事 出 现 的 情况 下 ) ,或 主语 
(在 施 事 不 出 现 的 情况 下 ); 系 事 Re 由 名 词性 成 分 充当 ,其 语义 特征 
是 指 职务 ( 记 作 NPL 十 position]) ,其 句法 属性 是 一 般 作 宾语 。 

下 面 , 分 别 描写 三 大 类 六 小 类 职务 变更 动词 的 论 旨 结构 及 其 名 
法 配置 方式 。 


3.1 任命 动词 的 论 骨 结构 


任命 动词 的 论 旨 结构 可 以 表示 为 : VL 十 appoint]: (A，Ex， 
Re} 。 其 句法 配置 主要 有 两 种 格式 : 


Sis: A 十 十 Ex 十 为 / 当 / 任 /担任 十 Re 
Su: Ex 十 被 LA 十 “十 为 / 当 / 任 /担任 十 Re 


方 括号 表示 其 中 的 成 分 有 时 可 以 省 略 。 介 词 “ 为 ”作为 格 标记 (case 
marker) ,应 该 跟 其 所 标记 的 系 事 格 连 在 一 起 ;但 是 它 可 以 跟 “ 当 、 
任 、 担 任 ? 等 动词 交替 使 用 ,所 以 变通 处 理 为 动词 。S 是 Su 的 被 动 
转换 格式 ,所 有 的 任命 动词 都 可 以 进入 这 两 种 格式 。 例 如 ， 

《5) [有 村西 可 总 统 塞 迪 略 ]A 任命 [ 女 参 议员 罗 萨 里 奥 。 格 

林 ]ex 为 [外 交 部 长 je。 ( 孙 ,35)@ 
(6)[ 徐 虎 ]gx 被 任命 为 [这 所 学 校 的 校长 ]ge。( 和 孙 ，,3) 
(7) [大 连 市 第 十 二 届 人 民 代 表 大 会 第 一 次 会 议 ]A{1 月 10 


Q@ 例句 后 括号 中 的 “ 孙 ” 表 示 引 自 孙 斌 (2000) 的 测试 语 料 , 数 字 代 表 语 料 的 文本 编 
号 ;这 编号 原文 没有 ,是 我 们 为 了 查找 和 核对 的 方便 而 加 上 去 的 。 
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日 }j7 选举 [于 学 祥 ]je, 为 [市 人 大 常委 会 主任 jg。，, 选 举 [ 薄 四 来 jex 
为 [大 连 市 市 长 jw。( 和 孙 ，,39) 

《8) [ 木 庭 健 太 慨 jex 被 选 为 [干事 长 jge。( 和 孙 ，9) 

(9) 塔 拉 尔 ; 于 1997 年 3 月 当选 巴 参 议院 议员 ,[ei]ex{ 同 
年 12 月 15 日 }r 被 [执政 党 穆斯林 联盟 谢 派 ]^A 提名 为 [总 统 候 
选 人 ]Rgs。( 和 孙 ，11) 


其 中 , 工 代 表 时 间 (time) 这 种 动词 的 非 核心 论 元 。e 代表 空 语 类 
Cempty category), 即 被 省 略 掉 的 成 分 ,下 标 表 示 这 个 空 语 类 跟前 面 
有 相同 下 标的 名 词性 成 分 所 指 相同 。 


3.2 担任 动词 的 论 旨 结 构 


担任 动词 的 论 旨 结构 可 以 表示 为 : VL 十 holdj: {(Ex，Re}。 其 
句法 配置 主要 有 四 种 格式 : 


S.: Ex 十 “十 [为 ]Re 
3 直 卫 2 症 十 Re 
SaiIEx 

Su: Re 十 由 Ex 十 


S:. 是 Szx 的 省 略 形式 ,Sz 是 Sm 的 变换 形式 。 所 有 的 担任 动词 都 可 以 
进入 Sz，, 除 了 “当选 ?可 以 后 加 介词 “为 ”, 其 他 都 不 行 。 只 有 “上 任 、 
当选 .就任 .就 职 .连任 .接任 、 继 任 、 获 任 ? 等 双 音 节 动 词 可 以 进入 
Se。 只 有 “担任 ` 出 任 . 兼 任 、 接 任 、 继 任 ” 等 少数 双 音 节 动 词 可 以 进 
大 Sza。 例如 : 


《10) {1996 年 初 }r7,[ 李 长 水 ]x 担 任 了 [市 公安 局 长 .党委 
书记 jge。( 和 孙 ，,5) 

[二 商 区 ) [ 刘 沈 明 j]jsx* 原 { 在 福建 省 海洋 渔业 公司 天 当 [ 车 闻 注 
任 ]gs。( 和 孙 ，4) 

(12) 香港 特区 政府 昨天 公布 了 香港 特区 基本 法 推广 督导 
委员 会 成 员 名 单 ,[ 政 务 司 长 陈 方 安生 ]e 出 任 [委员 会 主席 村 。， 
[高 车 华 ]ex 任 [ 副 主 席 ]se。 (和 孙 ，2) 
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(13) 邢 云 ;,1952 年 生 , 大 学 文化 。[ei]ex 历 任 [ 内 蒙古 伊 克 
上 昭 盟 副 盟 长 . 盟 委 副 书 记 、 盟 长 ]ge,(1996 年 10 月 起 }r 任 [ 盟 委 
书记 、 盟 人 大 工 委 主任 js 。( 和 孙 ，23) 

(14) 1938 年 2 月 ,中 共 晋 费 豫 省 委 在 太 拓 区 兴 县 设立 办 事 
处 ,由 [省 委 统战 部 部 长 安子 文 ]ex 兼 任 [ 办 事 处 主任 js。 (和 孙 ， 
28) 

(15)[ 原 中 联 办 主任 姜 因 柱 ]ex 获 任 [ 人 大 外 事 委 副 主 任 委 
员 ]g。。( 南 方 网 ) 

(16) [现任 信息 产业 部 部 长 王旭东 jx 接任 [国信 办 主任 一 
职 ]Re。 《南方 网 ) 

(17) 摩洛哥 新 一 届 两 院 制 议会 7 日 选 出 第 一 任 参议 院 议 
长 ,[ 原 摩洛哥 一 院 制 议会 议长 艾 赛 义 德 jex 当 选 为 [第 一 任 议 
长 ]gs。 代 表 院 议长 ; 已 于 6 日 选举 产生 ,[ 原 议会 第 一 副 议 长 拉 
迪 jsx 当 选 Lei je。 ( 孙 ，34) 

(18) [巴基斯坦 穆斯林 联盟 谢里夫 派 候 选 人 、 原 最 高 法 院 
大 法 官 穆罕默德 。 拉 斐 克 ，。 塔 拉 尔 je (今天 jr{ 在 巴 国民 议 
会 ,参议 院 以 及 各 省 议会 选举 中 }L， 当 选 [巴基斯坦 第 九 任 总 
统 ]e, 任 期 5 年 。( 孙 ,1) 


其 中 江 代表 处 所 (location) 这 种 动词 的 非 核 心 论 元 。 
3.3 免职 动词 的 论 旨 结构 


免职 动词 的 论 旨 结构 可 以 表示 为 : VL 十 remove]: {(A，Ex， 
Re} 。 其 句法 配置 主要 有 四 种 格式 : 


S,。，A 十 _ 十 Ex[ 的 ] 十 Re[ 的 ] 职 务 
Sa : Ex 十 被 LA] 十 十 ReL 的 ] 职 务 
Si: A 十 十 Ex 的 职务 

Su: A 十 对 Ex 十 


Sa 是 Si 的 被 动 转换 格式 ,S:. 是 Ss. 的 省 略 形式 。“ 免 去 、 撤 销 、 撤 消 、 
撤除 .解除 .罢免 ?等 及 物 动词 都 可 以 进入 Si ., 不 能 进入 Sia; 免 
职 . 撤 职 ” 等 不 及 物 动 词 只 能 进入 Si ,不 能 进入 S。.。 例 如 ， 
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《19) 新 华 社 在 会 后 不 久 就 宣布 ,[ 中 共 中 央 ]A 已 经 撤除 
[ 张 文 康 jex[ 在 卫生 部 的 党 职 ]ge。 (雅虎 中 国 ) 

《20) [咸阳 市 人 大 常委 会 ]A 决定 撤消 [ 张 定 会 jgx[ 副 市 长 
职务 je 。( 中 新 网 ) 

《21) 邓 良 钟 ; 原 任 四 川 省 内 江 市 市 长 ,[ 他 ijsx{ 因 接受 贿 
赂 }m 被 依法 撤消 职务 。 四 川 省 十 届 人 大 常委 会 四 次 会 议 ; 于 7 
月 25 日 通过 村 免 案 ,Lei]A 罢免 [ 导 良 钟 jsx[ 十 届 全 国人 大 代表 
职务 ]ke。 (新华 网 ) 

《22) 俄罗斯 总 统 普 金 ;23 日 签署 命令 ,[ei]A 解除 [ 亚 历 出 
大 ， 阿 夫 杰 耶 夫 ]e, 的 [第 一 副 外 长 职务 ]as，* 同 时 任命 瓦 列 里 。 
洛 希 宁 为 第 一 副 外 长 。( 新 华 网 ) 

(23) 9 月 7 日 ,铁道 通信 信息 有 限 责 任 公 司 发 生 重 大 人 事 
变动 。[ 原 总 经 理 彭 朋 ]ex{ 经 营 事 会 召开 临时 会 议 }w， 被 解除 职 
务 , 新 任 铁通 公司 总 经 理由 乔 金 洲 担任 。( 新 浪 网 ) 

《24) [田凤山 jsx{ 因 违纪 }an 被 免 去 [国土 资源 部 部 长 职 
务 ]s。。( 中 国 网 ) 

其 中 ,Rn 和 M 分 别 代表 原因 (reason) 和 方式 (manner) 这 
两 种 动词 的 非 核心 论 元 。 


3.4 辞职 动词 的 论 旨 结构 


辞职 动词 的 论 旨 结构 可 以 表示 为 : V[ 十 resign]: {Ex，Re) 。 
其 句法 配置 主要 有 四 种 格式 : 


Su: Ex 十 十 Re[ 的 ] 职 务 
Sib: 了 Ex 十 十 Re 

S，: 互 x 填 ， 牛 取 务 

Say 卫 x 十 


Seo-. 是 Se 的 省 略 形式 。“ 辞 去 ?等 及 物 动 词 都 可 以 进入 Se-.… 不 能 
进入 Su 入 辞职, 离 任 下台、 任 满 ” 等 不 及 物 动 词 只 能 进入 Sa, 不 能 
进入 Se -。 例 如 : 
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(25) 墨西哥 恰 帕 斯 州 议会 7 日 批准 [ 胡 里 奥 。 重 依 斯 jex 厦 
去 [州长 职务 ]g。，, 并 任命 众 议 员 罗伯特 ， 阿 尔 沃 震 斯 。 纪 廉 为 


新 州长 。 


〈 孙 ,40) 


(26)[ 以 克 劳 斯 为 首 的 捷克 原 政府 jz 是 { 一 九 九 七 年 十 一 
月 三 十 日 j7 被 迫 辞 职 的 。( 和 孙 ，10) 
(27) 驻 港 部 队 司令 员 调整 ,[ 熊 自 仁 jex 离 任 , 王 继 堂 接任 。 


〈 南 方 网 ) 


3.5 调 踢 动词 的 论 骨 结 构 


调 遗 动词 的 论 旨 结构 可 以 表示 为 : VL 十 dispatch]: {A，Ex， 
Re} 。 其 句法 配置 主要 有 五 种 格式 : 


: 入 十 ”十 Ex 十 当 / 任 / 反 任 十 Ke 

: A 十 把 Ex 十 由 Re 十 十 为 Resz 
: Ex 十 被 A 十 由 Re 十 十 为 Re 
Sia : 
S5e : 


Ex[ 的 职务 ] 十 “十 为 Re 
Ex[ 的 职务 ] 十 由 Rel 十 十 为 Res 


其 中 ,Rel 表示 原来 的 职务 ,Res 表示 变更 后 的 职务 。Ssa- 可 以 看 作 
是 Si. 的 省略 形 式 。 只 有 “ 调 ” 等 少数 动词 可 以 进入 Si, 只 有 " 升 、 提 
升 、 提 拔 ” 等 动词 可 以 进入 Se 和 Si.。 在 实际 的 新 闻 语 料 中 ,Sse-. 这 
些 格式 的 用 例 并 不 多 见 ,常见 的 是 St_。 这 些 格式 的 用 例 。 例 如 : 
(28) { 根 据 越南 国家 主席 和 政府 总 理 的 决定 ju,[ 国 防 部 长 
范文 茶 ]ex 由 [中 将 je 提升 为 [上 将 je 。 〈( 孙 ,14) 
(29) [部 十 国 ]e 的 职务 虽 已 升 为 [分 管 户籍 、 外 勤 的 副 所 


长 ]s。 o 


〈 孙 ,45) 


3.6 受命 动词 的 论 旨 结构 


受命 动词 的 论 旨 结 构 可 以 表示 为 : VL 十 transfer]: (Ex，Re)} 。 
其 句法 配置 主要 有 两 种 格式 : 


Sa : 


Ex 十 由 /从 Rei 十 十 为 Res 
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Si : Ex 十 “十 Re 
只 有 “调任 ”等 少数 动词 可 以 进入 Ses 。 例 如 : 
《30) [诸葛 彩 华 jex 从 [县 委 副 书 记 岗 位 js 调任 [ 代 县 
长 ]ge 。( 和 孙 ，42) 


《31) [ 史 有 彪 ]sx{1987 年 8 月 )r 调任 [市 委 农 工 部 副 部 长 、 
农业 委员 会 副 主任 ]ge。( 和 孙 ，44) 


4 论 元 角色 和 模板 元 素 的 对 应 关系 


孙 斌 (2000) 的 职务 变动 信息 抽取 模型 中 共有 四 个 特征 ( 必 备 
格 ): 时 间 (Time)、 组 织 COrg) .职务 (Posty 和 人 物 (Person)。 其 中 ， 
人 物 在 任职 事件 (Start_job) 中 具体 化 为 任职 者 (Who_in) ,在 离职 事 
件 (Leave_job) 中 具体 化 为 离职 者 (Who_out) ,在 调职 事件 CChange _ 
job) 中 则 既是 前 一 个 职务 的 离职 者 ,又 是 后 一 个 职务 的 任职 者 。 这 
四 个 事件 模板 元 素 , 基 本 上 都 能 在 相应 的 职务 变更 动词 的 论 元 结构 
中 找到 。 

一 般 地 说 ,人 物 就 是 经 事 (Person < Ex) ,少数 经 事 在 作 后 续 句 
的 主语 时 可 以 承 上 文 而 省 略 ( 如 : 9.13)。 职 务 就 是 系 事 (Post < 
Re) ,调职 事件 的 前 一 个 职务 是 系 事 Rel、 后 一 个 职务 是 系 事 Re2。 
少数 系 事 可 以 承 上 文 而 省 略 ( 如 : 17.21.23); 至 于 “辞职 . 离 任 ”等 极 
少数 辞职 动词 ,其 系 事 一 定 不 能 在 本 小 句 中 出 现 ( 如 : 26.27)。 时 间 
就 是 时 间 论 元 (Time < T 。 时 间 工 属于 动词 的 非 必 有 (optional) 
论 元 ,一 般 不 必 在 论 元 结构 中 表示 出 来 。 因 为 ,一 方面 它 基本 上 是 对 
所 有 的 动词 都 开放 的 , 即 每 一 个 动词 都 可 以 拥有 一 个 时 间 论 元 ; 另 一 
方面 它 的 句法 位 置 是 比较 固定 的 .可 以 预测 的 ,通常 在 动词 之 前 ,并 
且 要 么 在 第 一 个 论 元 之 前 (如 : 例 10)、 要 么 在 第 一 个 论 元 之 后 (如 : 
例 7.9.13、18、26.31)。 当 然 , 也 可 以 承 上 文 而 省 略 ( 如 : 例 14、.21 一 
23、25) 。 组 织 一 般 在 系 事 论 元 中 充当 职务 名 词 的 修饰 语 ( 如 : 例 5 一 
7、10、12 一 16、18、19、.21、.24.31)。 也 可 以 作为 动词 的 处 所 这 种 非 必 
有 论 元 ,在 动词 前 面 以 状语 的 句法 身份 出 现 ( 如 : 11)。 当 然 , 也 可 以 
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承 上 文 而 省 略 ( 如 : 8、.9.17、.20.23、25、27、30) 。 

为 了 概括 ,可 以 根据 所 能 支配 的 必 有 论 元 的 数目 和 类 别 , 把 上 文 
六 类 职务 变更 动词 分 为 两 大 类 : (i) 使 动 类 ,包括 任命 .免职 .调遣 三 
类 动词 。 其 特点 是 : 有 {A,， Ex，Re} 三 个 论 元 角色 ,其 主要 的 句法 格 
式 是 Si: [LT 二 ] A 十 _ 十 Ex 十 [ 当 / 任 十 ] Re, 相 应 的 事件 框架 为 Ei: 
[Time 十 ] A 十 ”十 Person 十 [ 当 / 任 十 ] Org-Post。(ii) 自动 类 , 包 
括 担任 .辞职 .受命 三 类 动词 。 其 特点 是 : 只 有 {Ex，Re} 两 个 论 元 角 
色 , 其 主要 的 句法 格式 是 Si: [LT 十 ] Ex 十 “十 Re, 相 应 的 事件 框架 
为 Ei: [Tiine 十 ] Person 十 “十 Org=Posts。 当然 ,为 了 准确 ,在 信息 
抽取 系统 的 分 析 词 典 中 ,每 一 个 职务 变更 动词 的 论 元 结构 都 应 该 得 
到 充分 的 描写 。 

孙 斌 (2000) 的 信息 抽取 模型 (InfoX) 的 系统 结构 中 ,有 一 个 
“Names 识别 ”模块 ;只 要 找 出 人 名 ,就 可 以 用 它 来 匹配 事件 模板 中 
的 人 物 这 一 模板 元 素 。 我 们 设想 ,对 于 处 理 职务 变动 文本 的 系统 ,还 
应 该 设置 三 个 识别 模块 : 一 个 “Post 识别 ?模块 ;只 要 找 出 职务 名 词 ， 
就 可 以 用 它 来 匹配 事件 模板 中 的 职务 这 一 模板 元 素 。 并 且 , 基 本 的 
职务 名 词 是 有 限 的 .可 列举 的 ;派生 的 职务 名 词 又 是 有 规则 的 ,如 
“一 长 ` 副 一 、 代 一 等。 一 个 是 “Org 识别 ?模块 ;只 要 找 出 组 织 、 机 构 
名 词 , 就 可 以 用 它 来 匹配 事件 模板 中 的 组 织 这 一 模板 元 素 。 并 且 ， 常 
用 的 基础 的 组 织 ` 机 构 名 词 是 有 限 的 ` 可 列举 的 ;派生 的 组 织 \ 机 构 名 
词 又 是 有 规则 的 ,如 “一 党 、 一 国 / 省 / 州 / 市 /县 、 一 部 / 厅 / 局 /处 、 
一 院 / 所 / 室 、 一 厂 / 公 司 、 一 委员 会 /理事 会 /董事 会 ?等 。 有 了 对 大 名 
和 职务 .组织 名 词 的 正确 识别 ,那么 包含 是、 成 为 ?等 抽象 动词 的 名 
子 也 容易 处 理子: 其 约束 条 件 是 : 当 其 前 面 的 成 分 是 人 和 名、 后面 的 
成 分 是 职务 名 词 时 , 这 些 成 分 的 论 元 角色 就 分 别 是 经 事 和 系 事 。 
例如 : 


(32)[ 兢 德 俊 ]s. 是 [北京 中 诚信 租赁 有 限 公司 的 董事 
长 jge。( 和 孙 ，,16) 

(33) 1992 年 ,刘涛 ; 进入 江西 农用 机 械 厂 ,[ei]e: 成 为 [总 工 
程 师 jge。 (和 孙 ,47) 
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最 后 一 个 是 “Time 识别 ?模块 ,只 要 找 出 时 间 名 词 ,就 可 以 用 它 来 匹 
配 事件 模板 中 的 时 间 这 一 模板 元 素 。 并 且 , 基 本 的 时 间 名 词 的 构造 
形式 是 有 规则 的 ;比如 ， 一 年 一 月 一 日 "。 指 代 性 的 时 间 名 词 又 是 可 
列举 的 ,比如 “今天 ,去 年 日 前 .此 后 ”等 。 


5 结语 : 动词 的 引导 作用 贯穿 全 过 程 


信息 抽取 系统 一 般 都 有 一 个 预 处理 过 程 , 以 过 滤 掉 文本 中 跟 抽 
取 目 标 无 关 的 句子 ( 达 90%% 左 右 ) ,然后 通过 词法 分 析 来 识别 跟 抽取 
目标 有 关 的 词汇 , 即 “ 关 键 词 ? 识 别 和 标 引 ;再 对 包含 关键 词 的 句子 作 
名 法 .语义 分 析 , 找 出 相关 的 数据 填 人 数据 模板 .@ 拿 职务 变动 文本 
来 说 ,其 关键 词 显然 是 职务 变更 动词 。 那 么 ,有 了 上 文 讨论 的 职务 变 
更 动词 的 分 类 及 其 语义 特征 、 每 一 小 类 动词 所 支配 的 论 元 角色 及 其 
语义 约束 和 句法 配置 方式 这 些 论 元 结构 知识 ,再 加 上 动词 的 论 元 角 
色 跟 事件 模板 元 素 的 匹配 关系 的 知识 ;势必 会 提高 信息 抽取 系统 工 
作 的 精确 性 ,包括 召回 率 ( 正 确 数 除 实 际 数 ) 和 正确 率 ( 正 确 数 除 抽取 
数 )。 这 样 , 对 含有 职务 变更 动词 的 句子 作 浅 层 分 析 的 主要 目标 便 
是 : 找 出 相关 动词 及 其 支配 的 论 元 角色 ,确定 有 关 短 语 的 边界 ,把 句 
子 中 有 关 的 命名 实体 Cnamed entities) 跟 句子 中 动词 的 论 元 角色 对 
应 起 来 ,为 把 论 元 角色 跟 模 板 元 素 匹 配 作 准 备 。 

当 模 板 匹配 完成 以 后 ,就 进入 后 处 理 阶 段 : 对 每 个 匹配 出 来 的 
实例 作 进一步 的 检查 和 修正 ,补足 相应 模板 中 空缺 的 槽 ;再 调用 三 不 
综合 处 理 函 数 把 有 关 实 例 合 并 起 来 ,形成 具体 的 表示 。@ 通过 调查 ， 
我 们 发 现 这 种 实例 合并 工作 仍然 可 以 用 动词 来 驱动 。 原 则 是 : 如 果 
几 个 句子 用 了 同一 个 或 同一 小 类 的 动词 ,并 且 其 论 元 角色 (包括 时 间 
等 非 必 有 论 元 ) 是 同 指 的 ;那么 ,它们 就 是 同一 个 事件 的 不 同 的 语句 
表达 ,应 该 合并 起 来 。 例 如 : 


(34) [在 背 尼 亚 大 选中 赢得 连任 的 肯尼亚 总 统 莫 伊 ]ss{5 


@ 详 见 孙 斌 (2000) ,第 106 一 107 页 。 
加“ 详 见 孙 交 (2000) ,第 116 一 117 页 。 
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}7 在 内 罗 毕 宣 垢 就 职 。 据 肯尼亚 选举 委员 会 昨天 正式 宣布 ， 
we 12 月 29 日 至 30 日 举行 的 大 选中 ,肯尼亚 非洲 民族 联盟 
候选 人 、 现 任 总 统 丹尼尔 。 阿 拉 普 。 英 伊 ; 以 较 大 优势 击败 了 
14 名 反对 党 候选 人 ,[ei] Ex 再 次 当选 为 [肯尼亚 总 统 ]jge，, 任 其 
5 年 。( 孙 ,20) 

(35) 陕西 省 咸阳 市 第 四 届 人 民 代 表 大 会 常务 委员 会 第 26 
次 会 议 ;{13 日 jz 通过 了 {[ 关 于 ([ei]A 撤消 [ 张 定 会 jsx[ 咸 阳 市 
人 民政 府 副 市 长 we)] 的 } 决定。…… 感 阳 市 人 大 常委 会 ; 决定 
[[e]A 撤消 [ 张 定 会 ]sx[ 副 市 长 职务 jge。 (新华 网 ) 


例 (34) 中 先后 用 了 “连任 .就 职 、 当选 ?三 个 担任 动词 ,但 其 论 元 角色 
的 所 指 相同 ;因此 ,可 以 合并 成 一 个 表示 。 例 (35) 先 后 用 了 同一 个 动 
词 ,并 且 其 论 元 角色 的 所 指 相同 ;因此 ,完全 可 以 合并 成 一 个 表示 。 

可 见 , 从 开始 预 处 理 时 的 关键 词 识别 ,到 中 间 的 模板 选择 和 模板 
元 素 匹 配 ,到 最 后 的 后 处 理 时 把 表达 同一 事件 的 实例 合并 表示 ,相关 
动词 一 直 起 着 驱动 和 引导 作用 。 因 此 ,这 种 以 动词 为 主导 的 信息 抽 
取 路 子 可 以 称 为 动词 驱动 的 信息 抽取 方法 。 

当然 , 光 靠 上 文 涉及 的 动词 语义 所 表示 的 事件 类 型 及 其 论 元 结 
构 知 识 , 显 然 是 不 够 的 ;还 应 该 考虑 基于 论 元 结构 的 篇 章 和 逻辑 知 
识 , 来 更 准确 地 确定 事件 的 信息 类 型 以 及 有 关 信 息 特 征 的 分 布 位 置 。 
这 正 是 我 们 另 一 篇 文章 的 主题 。 
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用 逻辑 和 篇 章 知 识 来 
约束 模板 匹配 


一 一 慑 辑 结 构 和 篇 章 结构 知识 在 信息 抽取 中 的 运用 


本 文 以 孙 斌 (2000) 的 语 料 为 主要 对 象 , 讨 论语 句 的 远 辑 结 构 和 篇 章 
结构 怎样 约束 信息 模板 的 类 型 ,并 约束 对 当前 名 中 缺失 的 或 以 代词 等 形 
式 表达 的 信息 项 目的 求解 。 首 先 说 明 什么 是 基于 论 元 结构 的 远 辑 结构 和 
篇 章 结构 知识 ,然后 分 析 否 定 算 子 、. 时 体 成 分 怎样 改变 事件 的 类 型 及 其 跟 
有 关 事 件 模板 的 匹配 关系 。 接 着 ,讨论 动词 的 论 元 结构 的 内 吝 和 名 词 化 
等 句法 操作 ,怎样 造成 有 关 论 元 及 相应 的 信息 项 目的 分 布 位 置 发 生变 化 。 
最 后 ,讨论 怎样 利用 篇 章 结构 知识 来 求解 本 名 中 缺失 的 或 以 代词 、 指 示 词 
形式 表达 的 信息 项 目 。 


1 基于 论 元 结构 的 逻辑 结构 和 篇 章 结构 


袁 毓 林 (2002) 指 出 ,除了 论 元 结构 知识 之 外 ,篇 章 结 构 和 逻辑 结 
构 知 识 对 信息 抽取 (information extraction) 也 有 十 分 重要 的 作用 。 
袁 久 林 (2005) 具 体 讨 论 了 怎样 建立 从 动词 的 论 元 结构 到 相关 的 事件 
模板 的 匹配 关系 。 本 文 打 算 进一步 说 明 语句 的 逻辑 结构 怎样 约束 信 
息 的 类 型 及 其 跟 有 关 的 事件 模板 的 匹配 关系 ,篇 章 结构 怎样 约束 当 
前 句 中 缺失 的 或 以 代词 指示 词 等 形式 表达 的 信息 项 目 及 其 跟 有 关 
模板 元 素 的 对 应 关系 。 

由 于 我 们 强调 动词 驱动 的 ` 以 论 元 结构 为 基础 的 信息 抽取 路 线 ， 
因而 对 语句 的 逻辑 结构 和 篇 章 结构 的 分 析 势 必 也 是 以 论 元 结构 为 基 
础 的 ;比如 ,它们 怎样 帮助 确定 论 元 结构 所 反映 的 信息 类 型 , 找 回 当 
前 论 元 结构 中 缺失 的 论 元 。 这 样 ,我 们 描写 语句 的 逻辑 结构 和 篇 章 
结构 就 有 了 一 个 明确 的 目标 和 参照 ,逻辑 结构 便 是 附加 在 论 元 结构 
之 上 的 和 否定 .时 体 和 模 态 等 巡 辑 算 子 及 其 变量 之 间 的 语义 约束 关系 ， 
篇 章 结 构 便 是 从 前 一 个 论 元 结构 到 后 一 个 论 元 结构 的 推进 和 关联 ， 
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特别 是 论 元 (包括 非 必 有 论 元 ) 的 传递 、 称 代 和 省 略 。 为 了 方便 ,可 以 
称 这 种 分 析 逻 辑 结构 和 篇 章 结构 的 方法 为 基于 论 元 结构 的 逻辑 结构 
和 篇 章 结构 分 析 法 。 

本 文 继续 以 孙 斌 (2000) 的 应 用 实例 “职务 变动 ”的 测试 语 料 为 主 
要 对 象 , 具 体 说 明 怎 样 用 基于 论 元 结构 的 逻辑 结构 和 篇 章 结 构 知 识 
来 约束 模板 匹配 、 找 全 模板 元 素 。 


2 用 逻辑 结构 知识 约束 信息 的 
类 型 及 其 模板 匹配 


圳 入 林 (2005) 指 出 ,在 职务 变动 文本 中 ,不 同类 别 的 职务 变动 
事件 由 不 同类 别 的 职务 变更 动词 来 表达 。 具 体 地 说 ,任职 动词 表达 
任职 事件 ,离职 动词 表达 离职 事件 ,调职 动词 表达 调职 事件 。 因 此 ， 
动词 的 类 别 可 以 决定 事件 模板 的 类 型 。 

事实 上 ,动词 的 类 别 跟 事件 模板 的 类 型 之 间 的 对 应 关系 ,常常 会 
受到 语句 的 逻辑 结构 的 影响 而 发 生 扭 曲 ; 当然, 这 种 扭曲 关系 也 是 有 
规律 的 。 常 见 的 情况 有 : 

2.1 香 定 算 子 改变 了 事件 的 类 型 ,使 之 适合 于 跟 动 词 意义 相反 
的 事件 模板 。 例 如 : 


(1) 黄 卫 任 建设 部 副 部 长 ,不 再 担任 江苏 省 副 省 长 取 务 。 
(南方 网 ) 


否定 副词 “不 ”使 得 “担任 ?表示 的 任职 事件 转变 为 离职 事件 。 据 此 ， 
可 以 得 出 规则 : 如 果 担任 动词 之 前 有 和 否定 算 子 ,那么 整个 句子 表示 
离职 事件 。 

2.2 时 体 算 子 改变 了 事件 的 类 型 ,使 得 句子 找 不 到 合适 的 事件 
模板 。 例 如 : 


(2) 阿 夫 赤 耶 夫 将 出 任 俄罗斯 驻 法 国 大 使 。( 新 华 网 ) 


表示 将 来 时 的 副词 “将 ”使 得 “出 任 ? 表 示 的 任职 事件 失去 了 现实 性 
Cirrealis) ,因而 无 法 找到 合适 的 事件 模板 。 据 此 ,可 以 得 出 规则 : 如 
果 职 务 变 更 动词 前 有 表示 将 来 时 的 词语 ,那么 没有 合适 的 事件 模板 
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可 供 匹配 
2.3 时 体 算 子 改变 了 事件 的 类 型 ,使 之 适合 于 跟 动 词 意义 相反 
的 事件 模板 。 例 如 : 


《3) 刘 沈 明 原 在 福建 省 海洋 渔业 公司 当 车 间 主 任 , 下 岗 5 
年 多 ,他 到 处 打工 。( 和 孙 ，,4) 

《4) 博 塔 曾 任 旧 南非 的 国防 部 长 ,总理 和 总 统 。( 和 孙 ，33) 

《5) 他 们 都 曾 担任 原 公 明 党 副 书 记 。( 和 孙 ，,10) 

(6) 塞 维 里 诺 是 菲律宾 的 一 一 位 外 交 家 ， 曾 先后 担任 菲律宾 
驻 美 国 \. 中 国 和 马来西亚 等 国 的 外 交 使 节 。( 和 孙 ,21) 

《7) 列 希 曾 连 续 担任 过 十 一 届 议 员 ，…'… ( 孙 ，,15) 

(8) 右 德 俊 是 北京 京 中 诚信 租赁 有 限 公司 的 董事 长 ， 曾 在 中 
汽 专用 汽车 珠海 制造 有 限 公司 任 过 总 经 理 。( 和 孙 ，,16) 


时 间 副 词 “ 原 、 曾 ”和 时 体 助 词 “ 过 ”表示 过 去 有 过 某 种 行为 或 状 
况 , 含 有 现在 已 经 不 是 这 样 的 意思 .Q 因此 ,它们 使 得 * 当 、 任 、 担 
任 ” 等 动词 表示 的 任职 事件 转变 为 离职 事件 。 据 此 ,可 以 得 出 规 
则 : 如 果 担 任 动 词 之 前 有 “ 原 ( 来 ) . 曾 ( 经 )” 等 表示 过 去 的 时 间 副 
词 或 之 后 有 表示 经 历 体 的 助词 “过 ”, 那 么 整个 句子 表示 离职 事 
件 。 

2.4， 时 体 算 子 改变 了 事件 的 类 型 ,使 单一 事件 变 成 复合 事件 。 
例如 : 


《9) 原 北 大 副 校长 陈 章良 任 中 国 农大 校长 。( 南 方 网 ) 

(10) 原 中 联 办 主任 差 恩 柱 获 任 人 大 外 事 委 副 主 任 委员 
(南方 网 ) 

钙 霹 巴基斯坦 穆斯林 联盟 谢里夫 派 候选 人 \ 原 最 高 法 院 大 
法 官 穆 罕 软 德 。 拉 斐 克 。 塔 拉 尔 ,今天 在 巴 国 民 议会 参议院 以 
及 各 省 议会 选举 中 ,当选 巴基斯坦 第 九 任 总 统 , 任 期 5 年 。( 孙 ， 
1 


《12) 摩洛哥 新 一 届 两 院 制 议会 7 日 选 出 第 一 任 参议 院 议 


@ 详 见 吕 叔 湘 主编 (2001) ,第 111 一 112、.247.638 一 639 页 。 
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长 , 原 摩洛哥 一 院 制 议会 议长 艾 赛 义 德 当选 为 第 一 任 议长 。 代 

表 院 议长 已 于 6 日 选举 产生 , 原 议会 第 一 副 议长 拉 迪 当选 。 

〈 和 孙 ，34) 
担任 动词 的 经 事 论 元 中 有 职务 名 词 作 同位 性 定语 ,并 且 这 个 定语 自 
己 还 有 区 别 词 “原作 修饰 语 ; 同一 个 经 事 既 有 以 前 的 ( 刚 印 任 的 ) 职 
务 . 又 有 新 任 的 职务 ,一 个 担任 动词 名 表达 了 同一 个 人 物 前 后 相继 地 
印 任 原职 务 .担任 新 职务 , 即 为 调职 .@ 据 此 ,可 以 得 出 规则 : 如 果 任 
职 动词 的 经 事 的 修饰 语 之 前 有 区 别 词 “ 原 ”, 那 么 整个 句子 表示 调职 
事件 。 

也 就 是 说 ,经 事 论 元 中 的 “ 原 ” 可 触发 调职 模板 。 可 资 比较 的 是 
下 面 这 些 句子 ， 


(13) 香港 特区 政府 昨天 公布 了 香港 特区 基本 法 推广 督导 
委员 会 成 员 名 单 , 政 务 司 长 陈 方 安生 出 任 委 员 会 主席 ,高 车 华 任 
副 主 席 。( 孙 ，2) 
(14) 南非 总 统 曼 德 拉 已 任命 南非 驻 中 国 研 究 中 心 主任 戴 
克 瑞 为 首 任 驻 华 大 使 。( 和 孙 ，12) 
例 (13)(14) 跟 (9) 一 (12) 句 式 基本 一 样 ,只 是 缺 一 个 “ 原 ” 字 ;就 有 两 
种 可 能 性 : 或 者 表示 兼任 ,或 者 表示 调职 。 但 是 ,根据 语言 交际 的 缺 
省 (default) 规 约 ,@ 可 以 把 这 种 不 用 “ 原 ” 的 无 标记 形式 看 作 是 任职 
(兼任 ) 事 件 。 


3， 论 元 结构 的 转换 和 信息 项 目的 分 布 


袁 航 林 (2005) 给 出 了 职务 变更 动词 的 论 元 结构 ,特别 是 动词 跟 
其 论 元 角色 的 句法 配置 方式 ,希望 为 信息 抽取 系统 提供 有 关 的 信息 


@ 和 孙 斌 (2000: 121) 指 出 ,一 个 “调职 ?事件 是 具有 某 些 共性 (约束 ) 的 两 个 “任职 "和 
“去 职 ” 事 件 的 归纳 ,这 两 个 至 少 需要 满足 的 约束 条 件 是 : 具有 相同 的 Person 值 ;Time 值 
前 后 相继 。 

四 “关于 缺 省 约定 , 详 见 袁 航 林 (1998) 第 26 .114、139 一 142 页 。 
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项 目的 分 布 位 置 。 必 须 指 出 , 当 论 元 结构 经 历 了 内 嵌 (Cembedding)、 
名 词 化 (nominalization) 等 语法 过 程 ,从 而 处 于 从 属 的 (subordinate) 
句法 地 位 时 ; 论 元 角色 及 其 对 应 的 有 关 信 息 项 目的 位 置 , 也 会 相应 发 
生 有 规律 的 变化 。 下 面 分 项 讨论 。 

3.1 首先 要 剔除 跟 动词 同形 的 其 他 词类 。 例 如 : 


(15) 据 肯 尼 亚 选 举 委员 会 昨天 正式 宣布 ,在 去 年 12 月 29 
上 日 至 30 日 举行 的 大 选中 ,肯尼亚 非洲 民族 联盟 候选 人 、 现 任 总 
统 丹 尼 尔 。 阿 拉 普 。 莫 伊 以 较 大 优势 击败 了 14 名 反对 党 候选 
人 ， 再 次 当选 为 肯尼亚 总 统 , 任 期 5 年 。( 孙 ,20) 


区 别 词 现任? 跟 * 前 任 ? 相 对 。 好 在 这 种 跟 职 务 变更 动词 同形 的 区 别 
词 不 多 。 

3.2 职务 变更 动词 中 有 一 部 分 属于 名 动词 , 兼 有 名 词 的 属性 ， 
表现 为 可 以 作 主 语 和 宾语 、 可 以 作 定语 直接 修饰 名 词 .0 例如 : 


(16) 人 大 常委 会 通过 一 批 免 职 与 任命 名 单 。( 南 方 网 ) 
当 这 种 职务 变更 动词 作 定语 时 ,其 论 元 角色 不 会 出 现 ,可 以 不 加 理 


会 。 


3.3 当 职务 变更 动词 的 论 元 结构 作 宾 语 小 句 时 , 论 元 角色 关系 
不 变 。 例 如 ; - 


《17) 村 西 哥 恰 帕 斯 州 议会 7 日 批准 [ 胡 里 奥 。 重 依 斯 荐 去 
州长 职务 ], 并 任命 众 议 员 罗 伯 特 。 阿 尔 沃 雷 斯 。 纪 廉 为 新 州 
长 。( 和 孙 ，,40) 

《18) 坦桑尼亚 总 统 姆 卡 帕 5 日 在 内 罗 毕 祝贺 [ 莫 伊 连任 肯 
尼 亚 总 统 ] 时 说 ……( 和 孙 ,27) 

(19) 感 阳 市 人 大 常委 会 ; 决定 [ei 撤消 张 定 会 副 市 长 职 
务 ]。( 新 华 网 ) 

〈20) 他 ; 决定 Lei 十 去 外 长 职务 ]。( 和 孙 ，,46) 

《21) 十 届 全 国人 大 常委 会 第 五 次 会 议 ;28 日 下 午 通过 表 


@ 关于 名 动词 , 详 见 朱 德 中 (1982) 和 朱德 让 (1985) 。 
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决 ,决定 [ei 任命 孙文盛 为 国土 资源 部 部 长 ]。( 中 国 网 ) 
(22) 陕西 省 咸阳 市 第 四 届 人 民 代 表 大 会 常务 委员 会 第 26 

次 会 议 i13 日 通过 了 人 [关于 (ei 撤消 张 定 会 咸阳 市 人 民政 府 副 市 

长 )] 的 ?决定 。( 新 华 网 ) 
(22) 是 “撤消 ”及 其 论 元 组 成 的 述 宾 结构 作 介词 “关于 ”的 宾语 , 然 
后 加 “的 ” 作 名 词 化 转换 ;这 个 “的 ” 字 结 构 再 作 “ 决 定 ” 的 定语 ,最 后 这 
个 复杂 的 NP 作 动 词 “ 通 过 ”的 宾语 。 四 层 嵌 套 之 后 “撤消 ”及 其 论 
元 的 论 旨 角色 和 和 句法 分 布 保持 不 变 。 

必须 注意 的 是 , 当 担 任 动 词 的 前 面 有 ”接替 ”等 动词 ,从 而 构成 
“NP; 十 接替 十 NP;: 十 担任 十 Re” 一 类 格式 时 ,就 表示 “NP: ”担任 了 
Re, 同 时 ，“NP:” 辞 去 了 Re。 例 如 : 


(23) 曾庆红 接替 胡锦涛 兼任 中 央 党 校 校长 。( 南 方 网 ) 


也 就 是 说 ,接替 ?类 动词 可 以 使 担任 动词 句 同 时 表示 任职 和 辞职 两 
个 事 你 。 

3.4 职务 变更 动词 跟 其 论 元 组 成 的 主 谓 结 构 之 间 可 以 插 和 人 助 
词 “ 的 ,来 使 整个 结构 名 词 化 ;但 是 , 论 元 角色 关系 保持 不 变 。 例 如 : 


(24) 重 依 斯 的 天 职 受到 各 方面 欢迎 。 (和 孙 ，40) 


因此 ,在 信息 抽取 时 可 世 不 理会 这 种 职务 变更 动词 之 前 的 “的 ”。 

3.5 . 当 职 务 变更 动词 的 论 元 结构 后 附 助 词 “ 的 ”表示 自 指 (self- 
designation) 时 , 论 元 角色 关系 不 变 ; 这 种 “的 ? 字 结 构 之 后 一 定 有 NP 
作 中 心 语 。 例 如 : 


《25) [中 国政 府 撤销 卫生 部 长 张 文 康 职务 ] 的 决定 是 完全 
正确 的 。( 联 合 早报 ) 

26) 上 届 安 庆 被 撤职 ] 的 原因 是 ……( 中 新 网 ) 

《27) [由 托 绍 夫 斯 基 出 任 总 理 ] 的 新 政府 共有 十 八 名 成 员 ， 
en。 ( 孙 ，10) 

(28) 1939 年 11 月 ,成 立 了 [以 薄 一 波 同 志 任 书记 ] 的 晋 东 


Q@ “关于 ?能 带动 词性 成 分 或 小 句 作 宾 语 , 详 见 吕 叔 湘 (2001) ,第 240 页 。 
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南 军 政委 员 会 。( 和 孙 ，,28) 
(29) 陕西 省 体育 局 今天 对 陕西 体 ( 育 ) 彩 ( 票 ) 中 心 主 任 员 
安庆 作出 [撤职 ] 的 决定 。( 中 新 网 ) 
如 例 (27)(28) 所 示 , 当 这 种 作 中 心 语 的 NP 是 机 构 名 词 时 ,正好 是 要 
抽取 的 Org( 组 织 ) 这 种 信息 项 目 。 例 (29) 则 是 更 为 复杂 的 表达 方 
式 “ 撤 职 ” 的 经 事 隐藏 在 主 句 的 状语 中 。 

3.6 当 职务 变更 动词 的 论 元 结构 后 附 助词 “的 > 表示 转 指 
(transferred-designation) 时 ,虽然 论 元 角色 关系 不 变 , 但 是 论 元 的 位 
置 会 发 生 有 规律 的 变化 。 这 种 "的 ? 字 结 构 之 后 作 中 心 语 的 NP 肯定 
是 动词 的 必 有 论 元 。 例 如 : 

(30) a.， 省 委 常 委 、 常 务 副 省 长 汪洋 曾 任 省 体委 主任 
一 b. [ 曾 任 省 体委 主任 ] 的 省 委 常 委 、 常 务 副 省 长 汪洋 提 

高 了 嗓门 …… (和 孙 ，,19) 

一 c.， 关 省 委 常 委 、 常 务 副 省 长 汪洋 曾 任 的 省 体委 主任 

(31) 冈 崎 嘉平 太 , 这 位 [ 曾 任 日 本 全 日 空 航 空 公司 总 载 ] 的 
老人 ,生前 一 百 多 次 来 中 国 为 恢复 中 日 邦交 奔波 。 (和 孙 ,36) 

(32) a. 拉 菲 克 。 塔 拉 尔 新 当选 巴基斯坦 总 统 

一 b. 新 当选 巴基斯坦 总 统 的 拉 菲 克 。 塔 拉 尔 

一 c. [新 当选 ] 的 巴基斯坦 总 统 拉 菲 克 。 塔 拉 尔 今天 在 这 

里 宣 郝 就 职 。( 孙 ,13) 

《33) [新 当选 ] 的 中 央 政 治 局 常委 与 中 外 记者 见面 。( 南 方 

网 ) 

《34) [在 肯尼亚 大 选中 赢得 连任 ] 的 肯尼亚 总 统 莫 伊 5 日 

在 内 罗 毕 宣 考 就 职 。( 和 孙 ，,20) 

《35) a， 上 级 刚 任命 童 志 成 当 一 把 手 ， 
一 b. 公司 其 他 领导 …… ,也 都 不 约 而 同 地 来 见 见 [上 级 刚 

任命 当 一 把 手 ] 的 童 志 成 。( 孙 ,37) 
虽然 “的 ” 既 可 以 提取 主语 ,又 可 以 提取 宾语 ,但 是 ,用 在 担任 动词 之 
后 时 ,一 般 只 能 提取 主语 ,不 能 提取 宾语 (如 30b，c)。 “新 当选 的 ?在 
句法 .语义 功能 上 相当 于 区 别 词 “新 任 ”, 后 面 一 般 是 由 组 织 、 职 务 名 
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词 和 人 名 构成 的 同位 性 偏 正 短语 (如 32c) ,或 者 直接 由 组 织 、. 职 务 名 
词 称 代 担 任 这 种 职务 的 人 名 (如 33) 。 这 种 “的 ? 字 结 构 后 面 的 组 织 、 
职务 人 名 正好 是 要 抽取 的 信息 项 目 。 


4 用 篇 章 结构 知识 找 回 缺失 的 信息 项 目 


在 有 的 职务 变动 文本 中 ,信息 抽取 模型 的 四 个 模板 元 素 ( 人 物 、 
时 间 、 职 务 组织) ,不 一 定 在 职务 变更 动词 所 在 的 小 句 中 都 出 现 。 于 
是 ,就 需要 利用 篇 章 结构 知识 来 求解 这 些 缺 失 的 、 或 以 代词 .指示 词 
Cdeixis) 形 式 表达 的 信息 项 目 。 

4.1 利用 语 篇 中 的 话题 ,求解 以 代词 或 空 语 类 形式 出 现 的 经 事 
(人 物 )。 例 如 : 


(36) 利 维 ; 当天 下 午 在 特拉维夫 宣布 ,{( 由 于 内 塔 尼 亚 胡 i 
未 能 对 他 所 提出 的 一 些 修 改 1998 年 度 国 家 预算 的 要 求 作 出 答 
复 ,他 ; 决定 辞去 外 长 职务 } 。( 孙 ,47) 

〈《37) 据 报道 ,该 暗杀 团伙 的 主谋 ; 是 哈 马 。 阿 马 杜 ;。 他 | 
现任 尼 ( 日 尔 ) 反 对 派 * 社 会 发 展 全 国运 动 ” 总 书记 ,[ei] 过 去 曾 
担任 过 政府 总 理 。( 和 孙 ，22) 

《38) 邢 云 ;,1952 年 生 , 大 学 文化 。[ei] 历 任 内 蒙古 伊 克 昭 
盟 副 盟 长 、 盟 委 副 书 记 、 盟 长 ,[ei]1996 年 10 月 起 任 盟 委 书 记 、 
盟 人 大 工 委 主任 。( 孙 ,23) 

《39) 烈 希 ; 曾 连续 担任 过 十 一 议员 ,[ei] 并 在 一 九 五 三 年 至 
一 九 八 二 年 期 间 担任 阿尔 巴 尼 亚 人 民 议会 主席 团 主 席 国家 元 首 
之 职 。( 和 孙 ，15) 

(40) 现年 60 岁 的 艾 赛 义 德 ; 是 摩 ( 洛 哥 ) 右 贾 党 派 宪 政 联 
盟 的 议员 ,法 学 博士 ,[ei] 曾 担任 过 国务 秘书 和 阿拉 伯 议 会 联盟 
委员 会 主席 等 职 。( 和 孙 ,34) 


从 上 例 可 以 看 出 ,这 种 代词 或 空 语 类 的 先行 语 (antecedent) 都 是 前 面 
小 句 中 作 主 语 ( 或 主语 中 的 中 心 语 ) 的 人 名 ,特别 是 具有 高 话题 性 的 
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人 名 。.@ 比如 ,(36) 中 “他 ?最 靠近 的 人 名 是 “内 塔 尼 亚 胡 ”, 但 是 整个 
语 篇 的 话题 是 主 句 主语 “ 利 维 >。(37) 的 后 续 句 中 的 “他 ?也 跟 先 行 名 
的 主语 同 指 ,但 是 这 个 主语 的 具体 所 指 要 靠 其 后 的 同 指 宾语 来 确定 。 
在 我 们 调查 的 81 个 职务 变动 句 中 ,这 种 以 代词 或 空 语 类 作 经 事 的 有 
13 句 , 约 占 16% 。 基 本 上 都 能 用 先行 句 的 主语 来 求解 其 所 指 。 据 
此 ,可 以 得 出 规则 : 作 经 事 的 代词 或 空 语 类 的 先行 语 就 是 先行 句 中 
的 人 名 ,特别 是 句 首 具 有 高 话题 性 的 人 名 。 请 

4.2 利用 先行 句 中 的 时 间 , 求 解 缺 失 或 以 指示 词 表达 的 时 间 。 
例如 : 


(41) 据 新 华 社 伊斯兰 堡 1 月 1 日 ; 电 ( 记 者 杨 士 龙 ) 新 当选 
的 巴基斯坦 总 统 拉 菲 克 。 塔 拉 尔 今天 ; 在 这 里 宣 考 就 职 。( 和 孙 ， 
13) 

(42) 新 华 社 斯 德 哥 尔 摩 1 月 7 日 ; 电 (记者 许 福 瑞 ) 曾 为 调 
解 巴勒斯坦 和 以 色 列 冲突 作出 过 努力 的 挪威 政府 ,最 近 ; 任命 罗 
德 一 拉 森 为 驻 中 东 巡 回 大 使 ……( 和 孙 ,31) 

(43) 塔 拉 尔 于 1997 年 ;3 月 当选 巴 参 议院 议员 ,同年 ;12 月 
15 日 被 执政 党 称 斯 林 联 盟 谢 派 提 名 为 总 统 候选 人 。( 孙 ,11) 

(44) 何 长 工 1952 年 8 月 ; 调 入 地 质 部 。 此 前 ; 曾 任 重 工 业 
部 副 部 长 、 代 部 长 …… ( 孙 ，,29) 

(45) 1984 年 , 广 昌 成 立 了 全 国 第 一 个 白莲 科研 所 , 刘 光 亮 
担任 所 长 5 ( 孙 ，,6) 

(46) 大 连 市 第 十 二 届 人 民 代 表 大 会 第 一 次 会 议 1 月 10 日 
选举 于 学 祥 为 市 人 大 常委 会 主任 ,选举 薄 申 来 为 大 连 市 市 长 。 
(和 孙 ,39) | 

(47) 新 华 社 北京 1 月 6 日 ; 电 中华 人民 共和 国 主 席 江 泽 民 
根据 全 国人 民 代 表 大 会 常务 委员 会 的 决定 ,任命 王 学 贤 为 中 华 
人 民 共 和 国 驻 南非 共和 国 特命 全 权 大 使 。( 孙 ,26) 

(48)“ 黎 明 俱 乐 部 ?共有 18 名 成 员 。 在 成 立 大 会 上 ，, 白 滨 


@ ”至 于 高 话题 性 (high topicality) 到 底 有 哪些 形式 指标 ,限于 篇 幅 , 暂 不 讨论 。 
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一 良 被 选 为 代表 , 木 庭 健 太 郎 被 选 为 干事 长 。( 孙 ,9) 
像 “ 今 天 、 同 年 ?和 最近、 此 前 ”等 是 指示 词 , 它 们 的 所 指 要 参照 说 话 
的 情景 或 上 下 文才 能 确定 ;因此 ,又 叫 索 引 词语 (indexical expres- 
sion) 。 其 中 ,前 者 是 语义 明确 的 指示 词 ,指示 某 个 特定 的 时 间 ; 后 者 
是 语义 模糊 的 指示 词 ,指示 大 概 的 某 段 时 间 。 如 例 (41) 一 (44) 所 示 ， 
它们 的 参照 词 可 以 从 先行 名 (包括 报导 引 语 ) 中 找到 。 相 应 地 ,在 信 
息 抽 取 的 输出 文档 中 , 这 种 时 间 应 该 采用 “指示 词 一 参照 词 ? 这 种 双 
重 标记 。 比 如 :“ 今 天 一 1 月 工 日 .此 前 一 1952 年 8 月 ”。 对 于 未 出 现 
时 间 词 语 的 句子 ,其 时 间 一 般 可 以 在 邻近 的 先行 句 中 找到 。 如 例 
(41) 一 (44) 所 示 。 像 (48) 这 种 句子 ,要 在 更 先前 的 句子 中 找到 成 立 
大 会 的 时 间 来 确定 任职 的 时 间 。 必 须 注意 的 是 , 82.4 中 (3) 一 (8) 
这 类 有 标记 的 “ 曾 任 ”事件 ,作者 可 能 无 意 给 出 明确 的 时 间 。 因 此 , 磁 
到 这 类 句子 ,如 果 本 句 中 没有 时 间 词 语 , 那 么 可 以 不 再 求解 。 即 把 该 
时 间 搁 置 起 来 ,处 理 为 隐 性 的 (covert) 信 息 项 目 。 据 此 ,可 以 得 出 规 
则 : 如 果 本 句 中 没有 时 间 词 语 ,那么 其 时 间 跟 先行 句 中 的 时 间 一 样 ; 
如 果 本 句 中 有 时 间 指 示 词 语 , 那 么 其 参照 时 间 就 是 先行 句 中 的 时 间 。 

4.3 利用 先行 句 中 的 职务 名 词 ,求解 本 句 中 未 出 现 的 职务 。 例 
如 : 


〈49) 陕西 省 体育 局 今天 对 陕西 体 ( 育 ) 彩 ( 票 ) 中 心 主任 贰 
安庆 作出 撤职 的 决定 。( 中 新 网 ) 

50) 陕西 体 ( 育 ) 彩 ( 票 ) 中 心 领 导 班子 被 勒令 辞职 。( 南 方 
网 ) 

《51) 新 当选 的 巴基斯坦 总 统 拉 菲 克 。 塔 拉 尔 今天 在 这 里 
宣 普 就 职 。( 和 孙 ，,13) 

(52) 以 克 劳 斯 为 首 的 捷克 原 政 府 是 一 九 九 七 年 十 一 月 三 
十 日 被 迫 夺 职 的 。( 和 孙 ，,10) 

《53) 村 西 哥 恰 帕 斯 州 议会 7 日 批准 胡 里 奥 。 重 依 斯 辞去 
州长 职务 .……- 和 鲁 依 斯 的 辞职 受到 各 方面 欢迎 。( 和 孙 ，40) 

(54) 墨西哥 总 统 塞 迪 略 任命 女 参议 员 罗 萨 里 奥 。 格 林 为 
外 交 部 长 。 格 林 同 日 在 就 职 后 宣布 ……( 和 孙 ，,35) 
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职务 名 称 及 其 所 属 的 组 织 名 称 , 是 及 物 的 职务 变更 动词 的 必 有 论 元 ， 
即 系 事 Re, 一 般 情 况 下 是 必须 出 现 的 。 像 撤职. 辞职. 就职" 等 不 及 
物 动 词 ,在 句法 上 不 允许 带 Re 这 一 论 元 ,于 是 就 以 经 事 的 修饰 语 或 
动词 的 状语 等 形式 出 现 ( 如 49 一 52)。 只 有 在 后 续 小 句 中 以 内 艇 或 
名 词 化 形式 出 现时 , 才 可 以 承 上 省 略 ( 如 53、.54)。 值 得 注意 的 是 , 职 
务 可 以 通过 转 喻 (metonymy) 的 修辞 手法 而 借 代 担任 这 种 职务 的 人 ， 
于 是 造成 经 事 ( 实 体 ) 跟 系 事 ( 属 性 ) 的 合 一 (如 50.52、.33)。 据 此 ,可 
以 得 出 规则 : 如 果 动 词 之 后 没有 职务 名 词 ,那么 到 动词 之 前 去 找 ; 如 
果 本 句 中 没有 职务 名 词 ,那么 到 先行 句 中 去 找 。 

4.4 利用 先行 句 中 的 组 织 名 词 ,求解 本 句 中 未 出 现 的 组 织 。 例 
如 : 


(55) 香港 特区 政府 昨天 公布 了 香港 特区 基本 法 推广 督导 
委员 会 成 员 名 单 , 政 务 司 长 陈 方 安生 出 任 委员 会 主席 ,高 若 华 任 


副 主席 。( 和 孙 ，,2) 
(56) 1938 年 7 月 ,在 沁 县 办 事 处 的 基础 上 成 立 了 中 共 太 项 
特 委 ,安子 文 同志 任 书 记 …'…。1939 年 4 月 ,中 共 太 项 特 委 改 


称 中 共 太 振 地 委 , 安 子 文 同志 任 书 记 。( 和 孙 ，,28) 
《57) 国务 院 调 整 三 峡 工 程 建 设 委员 会 ,温家宝 兼任 主任 。 
(南方 网 ) 
658)“ 黎 明 俱 乐 部 ?共有 18 名 成 员 。 在 成 立 大 会 上 ,和 白 滨 
一 良 被 选 为 代表 , 木 庭 健太郎 被 选 为 干事 长 。( 和 孙 ，9) 
像 “ 成 立 改称 、 调 整 动 词 后 的 组 织 名 称 , 往 往 是 后 续 的 担任 动词 的 
系 事 所 属 的 组 织 。 例 (58) 是 组 织 名 称 作 主语 这 种 具有 高 话题 性 的 成 
分 ,因而 后 续 句 中 可 以 省 去 对 这 个 组 织 的 交代 。 据 此 ,可 以 得 出 规 
则 : 如 果 本 句 中 没有 组 织 名 词 ,那么 到 先行 句 中 去 找 。 


5 结语 : 论 元 结构 知识 的 广泛 适用 性 


完整 的 信息 抽取 包括 三 个 层次 的 任务 : 《iD 模板 元 素 任务 ,抽取 
文本 中 相关 的 命名 实体 ,诸如 专 有 名 词 . 时 间 词 语 ` 数 量词 语 等 ;Cii) 
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模板 关系 任务 ,抽取 命名 实体 之 间 的 各 种 关系 (事实 ) 等 ,诸如 Loca- 
tion_ of ，Employee_of ，Product_of 等 关系 ; (iii) 脚本 (scenario) 模 
板 任务 ,抽取 指定 的 事件 ,包括 参与 这 些 事件 的 各 个 实体 .属性 或 关 
系 ; 比 如 ,航天 器 发 射 事件 及 其 涉及 的 运载 工具 、 负 载 客 体 . 时 间 和 场 
地 等 像 孙 斌 (2000) 的 InfoX, 就 是 一 个 脚本 模板 技术 模型 。 

显然 ,动词 的 论 元 结构 是 一 种 非常 适合 于 上 述 任务 的 语言 知识 。 
论 元 角色 对 应 于 模板 元 素 , 论 元 之 间 的 论 旨 角色 关系 对 应 于 模板 关 
系 , 相 关 的 一 组 动词 的 论 元 结构 及 其 关联 对 应 于 脚本 模板 。 再 辅 之 
以 基于 论 元 结构 的 逻辑 结构 和 篇 章 结构 知识 ,那么 信息 抽取 就 获得 
了 比 词语 切 分 .词类 ,短语 边界 和 句法 成 分 等 更 具 结构 性 的 .更 针对 
工作 目标 的 语言 知识 。 汉 语 语 法 学 界 自 上 世纪 八 十 年 代 以 来 ,在 动 
词 配 价 研究 名 目下 对 汉语 动词 的 论 元 结构 进行 了 大 规模 的 研究 ,这 
些 研究 成 果 值得 从 事 信 息 抽取 研究 的 学 者 去 改造 和 利用 。 
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基于 论 元 结构 的 
语义 标注 的 体系 和 规范 


本 文 讨 论 对 汉语 真实 文本 进行 语义 关系 分 析 和 标注 的 体系 和 规范 ， 
说 明 篇 章 语义 、 论 旨 角 色 和 逻辑 语义 这 三 种 层面 的 语义 关系 ,都 能 以 论 
元 结构 为 基础 来 进行 分 析 和 标注 ,从 而 提出 了 一 种 基于 论 元 结构 的 汉语 
语义 关系 的 标注 体系 : (i) 以 谓词 的 论 旨 结构 为 基础 ,给 谓词 所 支配 的 
各 个 论 元 标注 论 旨 角色 ;(iD 给 附加 在 论 元 结构 上 的 否定 、. 时 体 和 模 态 
算 子 等 远 辑 成 分 标注 语义 功能 及 其 辖 域 , 给 指 代词 标注 照应 关系 ;( 这 ) 
给 联结 不 同 的 论 元 结构 的 语 篇 衔接 词语 标注 篇 章 功能 及 其 配对 关系 。 
同时 ,为 这 三 个 层面 上 的 各 种 语义 关系 设计 了 便于 记忆 的 标记 ,形成 了 
一 套 可 扩充 的 标记 集 。 并 且 ，, 还 为 各 种 语义 关系 的 标注 制定 了 比较 具体 
的 操作 规范 。 最 后 ,展示 怎样 从 经 过 上 述 语义 标注 的 语 料 上 自动 地 为 多 
子 建立 语义 依存 树 和 身 法 关系 树 , 还 讨论 了 这 种 语料库 在 信息 抽取 、 机 
器 学 习 等 领域 的 应 用 。 通 过 对 数 万 字 新 闻 文 本 的 手工 标注 ,显示 出 这 套 
标注 体系 对 真实 语 料 具有 较 好 的 适应 性 和 较 高 的 语义 关系 信息 的 覆盖 
率 。 


1 语义 标注 的 目标 .内 容 和 体系 


袁 笠 林 (2002) 指出 ,为 了 给 信息 抽取 (information extraction ) 
等 自然 语言 信息 处 理 提供 充分 的 语义 知识 方面 的 资源 ,有 必要 对 一 
定数 量 的 真实 文本 进行 语义 关系 标注 ,建立 一 种 标 有 语义 关系 网 络 
的 精炼 语料库 .O 要 进行 语义 关系 标注 ,首先 要 解决 的 问题 是 标注 
什么 , 即 标注 的 内 容 问 题 ; 其 次 要 解决 的 问题 是 怎么 标注 , 即 标注 的 
规范 问题 。 其 实 , 标 注 什 么 和 怎么 标注 ,是 受 语义 标注 的 目的 引导 


@ 为 了 区 别 于 树 库 (tree bank, 即 标注 了 句法 树 关 系 的 语料库 ) ,标注 了 语义 网 络 关 
系 的 语料库 可 以 叫 作 网 库 (Cnet bank) 。 
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的 。 我 们 以 从 真实 文本 中 抽取 用 户 指 定 的 信息 为 应 用 目标 ,通过 一 
段 时 间 的 尝试 后 发 现 , 对 于 信息 抽取 等 广泛 地 涉及 到 词 项 之 间 和 和 句 
子 之 间 的 语义 关系 的 语言 信息 处 理工 作 来 说 ,如 下 三 个 层面 的 语义 
知识 是 非常 重要 的 : 〈i) 篇 章 结构 关系 ,包括 小 名 之 间 .句子 之 间 、 甚 
至 段落 之 间 的 语义 关系 ; (ii) 论 元 结构 关系 , 主要 是 动词 .形容词 等 
谓词 性 成 分 跟 受 其 支配 的 体 词性 成 分 之 间 的 语义 关系 ; (iii) 逻辑 结 
构 关 系 , 主 要 是 否定 算 子 .时 体 算 子 、 模 态 算 子 跟 受 其 约束 的 成 分 之 
间 的 逻辑 语义 关系 ,也 包括 代词 .指示 词 (deixis) 跟 其 先行 语 之 间 的 
照应 关系 Canaphoric relation) 。 

通过 对 职务 变动 文本 的 语义 关系 分 析 , 圳 航 林 (2005a，b) 又 发 
现 : 上 述 三 个 层面 的 语义 知识 可 以 以 论 元 结构 知识 为 核心 来 组 织 和 
表示 。 这 样 , 尿 辑 结构 便 是 附加 在 以 动词 为 中 心 的 论 元 结构 之 上 的 
否定 、. 时 体 和 模 态 算 子 跟 论 元 结构 中 的 有 关 成 分 的 语义 约束 关系 ;篇 
章 结构 便 是 从 前 面 的 论 元 结构 到 后 面 的 论 元 结构 的 推进 和 关联 ,其 
中 也 涉及 到 论 元 的 传递 \ 称 代 和 省 略 等 问题 。 对 这 些 内 容 进 行 标注 ， 
就 形成 了 基于 论 元 结构 的 语义 标注 体系 。 

有 了 这 些 理论 和 认识 上 的 准备 ,我们 开始 对 关于 职务 调动 的 真 
实 新 闻 文 本 进行 语义 关系 标注 实践 ,逐步 摸索 出 一 套 简 明 自 然 , 大 体 
完备 自 洽 的 基于 论 元 结构 的 语义 标注 体系 及 相关 规范 。 下 面 , 分 别 
按 上 述 的 三 个 层面 分 别 介绍 和 讨论 。 


2 论 旨 角 色 关 系 的 标注 及 其 规范 


2.1 论 旨 角色 的 名 称 和 定义 


动词 的 论 元 结构 包括 动词 的 论 元 属性 (可 以 支配 的 论 元 数目 )、 
论 旨 角色 关系 (这 些 论 元 跟 动 词 的 语义 关系 六 配 位 关系 (动词 跟 其 论 
元 可 以 构成 哪些 句法 格式 ) 等 内 容 。 对 于 在 真实 文本 上 进行 语义 标 
注 来 说 ,只 有 论 旨 和 角色 关 系 才 是 必须 标明 的 语义 信息 ,其 他 暂时 撤 开 
不 管 。 论 旨 和 角色 关系 最 终 体 现 为 给 受 动词 支配 的 论 元 指派 施 事 、 受 
事 等 语义 角色 ,简称 论 元 角色 。 关 于 论 元 角色 的 种 类 、 名 称 、 定 义 、 及 
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其 英语 速写 ,我 们 基本 按照 袁 航 林 (2002b)。 根 据 不 同 论 元 跟 动 词 
的 语义 关系 和 句法 实现 的 情况 ,可 以 把 论 元 分 为 必 有 的 Cobligatory) 
和 非 必 有 的 Cnon-obligatory) 两 大 类 , 必 有 论 元 又 分 为 主体 论 元 
(Csubject argument) 和 客体 论 元 (object argument) 两 小 类 ; 非 必 有 论 
元 又 分 为 任 借 论 元 Cmeans argument) 和 环境 论 元 (environment ar- 
gument) 两 小 类 ;然后 是 各 种 具体 的 论 元 ,当然 底下 还 可 以 再 分 出 各 
种 小 类 来 。 
从 我 们 对 真实 新 闻 文 本 的 语义 标注 实践 来 看 ,经 常 伴 到 的 是 以 
下 这 些 论 元 : 
(一 ) 必 有 论 元 : 
A. 主体 论 元 : 
(1) 施 事 (agent, 简写 为 A): 自主 性 动作 行为 的 施行 者 。 
(2) 感 事 (sentient ,简写 为 Se): 非 自主 性 的 心理 感觉 的 主 
体 。 
(3) 经 事 (experiencer ,简写 为 Ex): 某 种 变化 的 具有 感知 
性 的 主体 。 
(4) 致 事 (causer, 简 写 为 Cau): 某 种 致使 性 事件 的 引起 
考 。 
(5) 主事 (theme, 简写 为 Th): 性 质 . 状态 等 无 施 动 、. 感 知 
性 的 主体 。 
B. 客体 论 元 : 
(1) 受 事 (patient ,简写 为 P): 因 施 事 的 行为 而 受到 影响 的 
事物 。 
(2) 与 事 (Cdative, 简写 为 D): 动作 \ 行 为 的 非 主 动 的 参与 
汪 
(3) 结果 (result ,简写 为 R): 动作 ,行为 造成 的 结果 。 
(4) 对 象 (target, 简写 为 Ta): 感知 性 动作 ` 行 为 的 对 和 象 和 
目标 。 
(5) 系 事 (relative, 简写 为 Re): 事件 中 中 主体 论 元 相对 的 
其 他 各 种 客体 。 
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(二 ) 非 必 有 论 元 
A. 凭借 论 元 : 

(1) 工具 (Cinstrument, 简写 为 TD): 动作 .行为 所 凭借 的 器 
具 。 

(2) 材料 (material, 简写 为 Ma): 动作 \ 行 为 所 用 的 材料 。 

(3) 方式 (manner ,简写 为 M) : 动作 行为 所 采取 的 方式 、 
(4) 原因 (reason, 简写 为 Rn): 动作 \ 行 为 事件 等 发 生 的 
原因 。 

(5) 目的 (aim, 简 写 为 Ai): 发 生动 作 、 行 为 .事件 等 的 目 
的 。 
B. 环境 论 元 : 

(1) 时 间 (time, 简写 为 ): 动作 、 行 为 .事件 等 发 生 的 时 
间 。 

(2) 处 所 (location, 简写 为 站 ): 动作 行为 .事件 等 发 生 的 
处 所 。 

(3) 源 点 (source， 简 写 为 So): 动作 行为 .事件 等 开始 的 
时 间或 处 所 。 

(4) 终点 (goal, 简 写 为 Go): 动作 行为 .事件 等 结束 的 时 
间 、 处 所 或 状态 。 

(5) 路 径 C(path, 简 写 为 Pa): 动作 行为 .事件 等 中 途经 过 
的 时 间或 处 所 。 

《6) 范围 (range, 简 写 为 Ra) : 动作 \ 行 为 .事件 等 所 涉及 的 
数量 、 频 率 、 幅 度 . 时 间 等 事项 。 


事实 上 , 源 点 终点 和 路 径 通常 是 跟 处 所 相关 的 ,于 是 ,我 们 约 
定 : 源 点 处 所 记 作 L(CS) ,终点 处 所 可 以 记 作 LCG)，, 介 于 源 点 和 终点 
之 间 的 路 径 处 所 可 以 记 作 LCP) 。 
2.2 论 旨 角 色 的 标注 规范 


51) 在 原则 上 , 论 旨 角 色 关 系 的 标注 是 以 动词 为 中 心 的 ,假定 
每 一 个 动词 (特别 是 作 谓语 核心 的 动词 ) 都 构成 一 个 论 元 结构 。 于 
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是 ,( 承 上 下 文 省 略 的 主体 论 元 、 客 体 论 元 等 必 有 论 元 都 看 作 是 空 
语 类 (Cempty category) ,用 [e] 作 标记 。 并 且 , 在 这 个 空 语 类 和 其 先 
行 语 上 加 同 指 (coreference) 下 标 ( 依 次 为 ji，j，k,…); 当 空 语 类 的 
先行 词 不 止 一 个 ( 即 空 语 类 是 复数 形式 ) 时 , 空 语 类 之 后 的 几 个 下 
标 用 加 号 连接 ;当空 语 类 的 先行 语 不 明确 时 ,可 以 用 问号 作 下 标 。 
(对 于 隐 含 在 语 境 中 的 必 有 性 论 元 成 分 ,用 PRO( 大 代号 ) 作 标记 。 
例如 : 


a。{(1989 年 })r[[ 梁 惠珍 ;jex* 退 体 后 jr,[[Leij 与 雪夫 jj 回 到 
[老家 湛江 je [Le]A 开办 《 予 wena[ “惠珍 联合 医院 bj,[ekj] 专 
治 [男女 不 育 这 ]。 

b. { 经 过 几 年 奋斗 }w ,他 让 A 带领 [ 乡 亲 们 ijP{ 通 过 股份 合 
作 制 jwy[Leti]A 办 起 [ 集 农 ` 科 、 贸 一 体 的 农业 集团 公司 卜 ， 
实现 (了 ?pet[ 农 业 产业 化 ]R。 

代 他 ; ]e: 上 任 后 }， [PROi]A 立即 召 开 [ 党 委 会 玉 ， 
本 ]^ 研究 [( 味 ) 群 众 息息相关 的 治安 间 题 ]。 

d. [ 闻 嫩 国 ， 的 职务 jexwm{ 虽 }cpsi( 已 ?ma s 升 为 [分 管 户籍 、 外 
勤 的 副 所 长 ]w.，{ 但 }veai[ 他 i]A 还 是 {“ 按 照 原来 的 那样 jw 做 
[PRO]swRg>”，……- 


一 般 地 说 , 空 语 类 通常 是 可 以 根据 上 下 文明 确 地 补 出 来 的 ,当然 由 于 
句法 结构 方面 的 限制 , 补 出 来 的 语句 形式 不 一 定 是 合 语法 的 。 大 代 
号 一 般 没有 先行 语 , 或 者 先行 语 不 明确 。 比 如 ,上 例 e 中 “召开 党 委 
会 ,研究 ……” 的 应 该 是 “ 李 常 水 ”和 ”党 委 一 班 人 ”。 

《2) 对 于 一 个 句子 中 有 多 个 动词 性 成 分 ,分 为 下 面 几 种 情况 : 
@ 对 于 氢 述 同一 个 主语 的 一 连 串 小 句 ,为 每 一 个 动词 性 成 分 标注 其 
论 元 角色 ,省略 的 用 空 语 类 补充 出 来 。 如 果 连 动 式 中 间 用 逗号 断 开 ， 
那么 看 作 不 同 的 小 句 。G@) 对 于 几 个 动词 连用 构成 的 并 列 结构 (如 
“指导 和 协调 ”) .关系 紧密 的 连 动 式 ( 如 "报道 说 ,宣誓 就 职 ") . 述 补 结 
构 (“ 开 进 、. 组 装 成 ?) “形式 动词 十 名 动词 ?组 合 ( 如 “ 作 斗 争 ”) 、 熟 语 
性 动词 组 合 ( 如 "说 好 话 . 感 兴趣 ?和 动词 重奏 形式 (如 “ 读 一 读 ”) 等 
动词 性 结构 ,把 它 当 作 一 个 谓词 来 标记 其 从 属 成 分 的 论 旨 角色 。@ 
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对 于 一 般 所 说 的 兼 语 式 ( 比 如 使 > 字句 ) ,在 兼 语 成 分 上 同时 标记 其 
相对 于 前 后 两 个 动词 性 成 分 的 论 旨 角色 ,用 合 取 符 号 && 来 连接 这 两 
个 论 旨 角 色 标 记 。2 同样 ,对 于 表示 存在 的 * 有 十 NP 十 VP” 等 格式 ， 
根据 NP 跟 “ 有 ”和 VP 的 语义 关系 ,分 别 标 注 两 种 论 旨 角色 。@ 对 
于 内 和 骨 小 名 (比如 "报道 等 动词 所 带 的 宾语 小 句 ), 也 需要 进行 语义 
标注 :通过 加 括号 来 标志 其 能 套 层次 ,不 同 层 次 的 括号 后 面 加 上 不 同 
层次 的 论 旨 角色 名 称 。@ 为 了 语义 标注 的 精细 ,的 ” 字 结 构 用 圆 括 
号 标示 ,其 中 的 谓词 性 成 分 ,可 以 标记 其 论 元 角色 等 语义 关系 ,其 中 
跟 中 心 语 同 指 的 空 语 类 用 下 标 来 标示 。 当 然 ,为 了 减少 标注 的 层次 ， 
也 可 以 暂时 把 “的 ” 字 结 构 当 作 一 个 NP 而 不 作 语义 关系 分 析 和 标 
记 。 例 如 : 


a，{1989 年 亲 [[ 梁 惠珍 mx 退 体 后 ],[[eg 与 款 : 大 党 记 回 到 
[老家 湛江 ,Le 共 开 办 4 了 ?ma[ "惠珍 联合 医院 t”]R ,ES 加 专 治 
上 男女 不 育 症 ]。 

b. [他 上 A{ 先 })rsv{ 从 日 本 ) es 进口 [原装 马 自 达 323i 至 
[香港 ]jey Fei]A 就 地 拆散 [Le jp，,{ 按 配件 }w 报关 进口 6 

c. [许多 人 u]A 便 主动 找 上 [ 门 ], 来 ,[ 有 的 n]A 拉 [ 站 证 
合伙 做 生意 ,[ 有 的 ]。( 想 )ouuf{[ 找 芭 说 时 叶 做 章 山 ]K)。 

d. [俄罗斯 国家 杜 马 (议会 下 院 )ijA{6 月 11 日 j7 出 台 [ 一 
项 法 律 j ,Le 授权 【国防 部 jpe。 掌管 [武装 部 队 的 重要 军事 
行动 jw ,[ 克 瓦 什 宁 的 总 参谋 部 ]A 主要 负责 规划 [俄罗斯 未 来 的 
军事 进程 ]。 

e. [分 析 家 js 认为 ,[CTPRO]A 指责 光志 种 字 叶 Re [为 印 
十 什 遇 黎 事 件 je 负 责 Jm 是 有 [一 定 依据 jg 的] o 

f [中 国 卫生 部 常务 副 部 长 高 强 ]A 说 ,[“[ 实 践 ]m 证 明 "， 
[CEL 中 国政 府 ]A 撤销 [卫生 部 长 张 文 康 职务 jg 的) 决定 ]m 是 


@ 虽然 从 语法 理论 上 讲 , 这 会 违反 生成 语法 的 GB 理论 中 的 论 旨 原则 : 一 个 论 元 只 
能 担任 一 种 论 旨 角色 ,一 种 论 旨 角色 只 能 赋予 一 个 论 元 。 但 是 ,从 语言 信息 处 理工 程 的 角 
度 上 讲 , 这 种 合成 标记 法 比较 经 济 ,也 便于 识别 和 处 理 , 具 有 更 高 的 效率 。 关 于 论 旨 原则 ， 
详 见 徐 烈 灿 (1988) 第 271 页 。 
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[ 完 全 正确 的 ”jge jg。 je。。 

g. [ 冈 峙 嘉平 太 ， 这 位 《[e] 交 任 [日 末 全 上 日 空 航 密 公司 总 ， 
裁 j 的) 老人] ,{( 生 前 )T 一 百 多 次 来 [中 国 je { 为 恢复 中 日 
邦交 } 奔波。 

(3) 对 于 省 略 的 动词 性 成 分 ,用 空 动词 符号 LVj] 作 标记 。 例 如 : 


a。 [和 孙文盛 ix 9 男 ,LeijeLVJ]L61 岁 ]。 ,LeijeaLVJjLD 东 威 
海 人 js,[LejesLV]L 大 学 学 历 ]ke,[Le]esLV][ 工 程 师 ]Re。 

b. { 现 在 )T,[ 十 届 全 国人 民 代 表 大 会 ]m 实 有 [代表 ]Reem 
[V][2977 人 ]。 

全 和 现任 总 统 丹 尼 尔 。 阿 拉 普 。 英 伊 ]x{ 以 较 大 优 
势 }jw 击败 (了 ywr[14 名 反对 党 候选 人 ]p,[ei] 再 次 当选 为 [ 肯 
尼 亚 总 冯 统 ] 久 L 任 期 ]mLV][L5 年 Re。 
人 的 >“ 就 是 ”等 强调 性 成 分 “被 迫 ?”“ 畅 行 无 阻 等 

方式 性 状语 等 成 分 暂 不 标记 。 例如 : 


+ [以 友 劳 疡 为 首 的 六 交 原 履 府 ]e 届 


(一 此 区 天 年 三 二胡 


(5) @ 为 了 区 别 , 必 有 论 元 用 方 括号 标志 , 非 必 有 论 元 用 花 括 
号 标志 ,并 分 别 在 这 两 种 括号 的 后 面 标 上 论 元 角色 的 名 称 ( 首 字母 大 
写 的 标记 )。@) 同一 种 论 旨 角色 ,对 于 有 的 动词 或 动词 短语 来 说 可 
能 是 必 有 论 元 ,但 是 对 于 另 一 些 动词 或 动词 短语 来 说 则 可 能 是 非 必 
有 论 元 。( 当 对 某 个 论 元 成 分 的 论 旨 角色 不 能 明确 断定 时 ,就 把 最 可 
能 的 论 旨 角色 名 称 依次 都 标 上 ,不 同 的 论 旨 角色 名 称 中 间 用 斜 撤 5CZ) 
来 表示 析 取 (disjunction) 关 系 。 例 如 : 


 a [阿尔 巴 尼 亚 前 人 民 议 会 主席 团 主席 列 希 ]es{ 一 日 晚 ) 


{ 在 地 拉 那 六 病 遂 ，…… 
bw [ 缆 德 俊 的 这 批 “海马 ”"]A 偷 逃 (了 ?pet[ 关 税 、 增 值 


税 、 消 费 税 ] ,畅行 无 阻 地 开 进 《 了 ?ea[ 京 城 ]-o 。 
< [捷克 总 统 哈 维尔 ]A{ 二 日 ji 任命 (了 )ui[ 捷 克 新 政府 成 
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员 ]sv ne。 

d. {([ 陈 云 峰 ]A 读 [ 电 大 ]gwv) 期 间 )ry， {1994 年 })T， 
[ 黄 赛 红 Aswse 考 取 ( 了 )eer[L 浙 江 省 政法 管理 干部 学 院 ]prgwvm， 

e. [诸葛 彩 华 jx [从 县 委 副 书记 岗位 jsyvRa 调 任 [ 代 县 
长 jeoyvaez 。 

《在 此 期 间 }T ,工商 系统 ]^ 实行 [体制 改革 jpwR，…… 


在 例 b 中 ,终点 性 处 所 “京城 ?是 “ 开 进 ”的 必 有 论 元 。 当 “任命 ”等 动 
词 的 客体 论 元 是 指 人 名 词 时 ,其 论 旨 角色 可 以 归 人 经 事 ; 当 “任命 ”等 
动词 的 客体 论 元 是 职务 名 词 时 ,其 论 旨 角色 可 以 归 人 系 事 ; 在 例 
中 ,捷克 新 政府 成 员 ” 似 乎 既 涉 及 人 员 ,又 涉及 职务 ;为 了 周全 ,可 以 
把 这 两 种 论 旨 角色 都 标记 上 去 。 在 例 d 中 ,对 于 动词 “ 读 ? 来 说 “ 电 
大 ” 既 像 是 系 事 ,又 像 是 方式 ;对 于 动词 “考取 ?来 说 ,其 主体 性 论 元 既 
像 是 施 事 、 又 像 是 经 事 或 感 事 , 其 客体 论 元 既 像 受 事 、 又 像 系 事 或 对 
象 。 对 于 动词 “调任 ?来 说 ,原来 的 职务 和 后 来 的 职务 都 是 系 事 ; 同 
时 ,从 路 径 隐 喻 (path metaphor) 的 角度 来 看 ,原来 的 职务 是 源 点 ,后 
来 的 职务 是 终点 。 

(6) 对 于 用 介词 引导 的 论 元 ,我们 约定 : 四 出 现在 动词 之 前 时 ， 
整个 介词 结构 都 置 于 一 个 括号 中 , 即 作为 一 个 论 元 成 分 ;出 现在 动词 
之 后 时 ,把 动词 和 其 后 的 介词 看 作 一 个 动词 性 成 分 ,把 介词 之 外 的 论 
元 成 分 置 于 一 个 括号 之 中 。 这 样 , 可 以 方便 地 处 理 这 种 结构 中 的 时 
态 助 词 ( 如 “ 回 到 了 [故乡 ]、 埋 在 了 [ 城 外 ]”) .9 _@ 介词 是 论 元 角色 
的 标志 ,俗称 “ 格 标记 ”(case marker) 。 为 了 醒目 , 跟 动 词 一 样 , 介 词 
也 用 着 重点 标注 。@ 为 了 一 致 和 醒目 ,动词 之 后 跟 动词 不 连续 的 介 
词 也 放 在 表示 论 元 成 分 的 方 括号 之 外 ;比如 ,把 “任命 …… 为 ”等 看 作 
是 一 个 动词 性 结构 , 即 一 种 不 连续 的 动词 性 成 分 。@ 当 "“ 被 等 引导 
必 有 论 元 的 介词 之 后 不 出 现 宾 语 时 ,应 该 用 空 语 类 [Fej] 作 标记 ,并 加 
上 同 指 下 标 和 论 骨 角色 标记 。 这 种 带 空 语 类 作 宾 语 的 介词 ,因为 作 
为 动词 短语 的 一 部 分 ,所 以 不 用 放 在 方 括号 中 , 即 单独 把 空 语 类 放 在 


@ 这 样 处 理 有 名 法、 语义 和 音 系 学 上 的 考虑 , 详 见 圳 入 林 (2003) 。 
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括号 中 。@ 承 上 文 而 省 略 的 成 分 “被 ……? 等 引导 必 有 论 元 的 介词 
结构 ,用 双重 方 括号 中 [[ 被 e]] 作 标记 ,并 给 空 语 类 标记 e 加 上 同 指 
下 标 , 和 在 [被 e] 之 后 加 上 论 旨 角 色 标 记 。 例 如 

a. [新 当选 的 巴基斯坦 总 统 拉 菲 克 。 塔 拉 尔 ]A{ 今 天 }T{ 在 
这 里 ): 宣 考 就 职 。 

b. [格林 ]m{1941 年 }j7 生 于 [ 肢 西 哥 城 ]。 

c. [大 连 市 第 十 二 届 人 民 代 表 大 会 第 一 一 次 会 议 ]{1 月 10 
日 ) 选举 [于 学 祥 ]ev 为 [市 人 大 常委 会 主任 Ju 选举 [ 薄 邮 
来 ]e. 为 [大 连 市 市 长 ]we。 

d. [ 塔 拉 尔 ijse{ 于 1997 年 j3 月 ) 当选 [ 巴 参 议院 议员 jge， 
[ei]sx{ 同 年 ;12 月 15 日 }7[ 被 执政 党 穆斯林 联盟 谢 派 ]A 提名 为 
[总 统 候选 人 je。 

已 s [和 白 滨 一 良 ]e: 被 [er ]A 选 为 [代表 ]ge,[ 木 庭 健 太 凤 ex 被 
[e* ]^A 选 为 [干事 长 ]Re。 


(7) 为 了 简单 ,把 邻接 的 复 指 性 成 分 处 理 成 一 个 论 元 。 例 如 

[网 峙 嘉平 太 ,这 位 ([e] 曾 任 [日 本 全 日 空 航空 公司 总 
]w 的 ) 老 人 ]A,{ 生 前 }r 一 百 多 次 来 [中 国 卫 { 为 恢复 中 日 部 
交 }A 奔 波 。 


(8) 不 同 的 句法 分 析 , 可 能 导致 不 同 的 语义 标注 。 应 该 从 中 选 
择 反 映 语义 关系 最 明确 的 一 eggAoenoewo er 
能 选择 相对 简单 的 标注 。 例 如 : 


a. [十 届 全 国人 大 常委 会 第 五 次 会 议 让 A{28 日 下 午 }7{ 通 
过 表决 }v， 决 定 [Lei]^ 任命 [孙文盛 jz 为 [ 国 土 资 源 部 部 
长 jw 2 


. [十 届 全 国人 大 常委 会 第 五 次 会 议 ]{28 日 下 午 }r 通 

直 [ 表 上 [RD]， 决定 [Lei]a 任命 [和 孙 文 感 ]E 为 [ 国 土 资 源 部 部 
长 jg Re。 

b. [十 届 全 国人 大 常委 会 第 五 次 会 议 ]A{28 日 j7{ 经 表 

决 ju 通过 [决定 ],[ei]aA 免 去 [田凤山 的 国土 资源 部 部 长 职 
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务 ]ge;Lei]A 任命 [和 孙 文 盛 ]m 为 [ 国 土 资源 部 部 长 je。 
氏 {[es 了 违规 调 人 jms ,咸阳 市 人 民政 府 副 市 长 张 定 
[被 人 大 ]A 搬 撤消 [职务 ]w。 
了 了 违规 调 人 jcnsy { {L 感 阳 市 人 民政 府 副 市 长 张 定 
< [被 人 坟 江 失 消 [职务 ]w } csa 。 
人 
落 je) )})m 被 Ley ] 罢免 。 


通过 跟 例 bp 比较 ,可 以 发 现 : 例 a 中 的 “通过 ”, 如 果 分 析 为 介词 , 那 

么 "通过 表决 ”就 是 方式 论 元 ,整个 句子 是 简单 名 ;如 果 分 析 为 动 
词 ,那么 “十 届 全 国人 大 常委 会 第 五 次 会 议 28 日 下 午 通过 表决 就 
是 一 个 小 名 ,整个 句子 是 由 两 个 小 句 构成 的 复合 名 ,后 一 小 名 承 前 
省 略 了 主语 。 通 过 跟 例 d 比较 ,可 以 发 现 : 例 c 中 的 “违规 调 人 ” 既 
可 以 分 析 为 原因 论 元 (整个 句子 是 单 句 ), 也 可 以 分 析 为 原因 小 名 
后 面 的 小 句 就 是 结果 小 句 ,整个 句子 便 是 复句 )。 相 对 来 说 ,简单 
句 比 复合 句 简单 , 单 句 比 复句 简单 。 因 此 ,优先 考虑 a 和 ec 这 两 种 
标注 方式 。 


3 ”逻辑 语 义 关 系 的 标注 及 其 规范 


3.1 逻 旬 语 义 关系 的 种 类 和 相关 词语 


根据 上 文 81 的 说 明 , 逻 辑 语 义 关系 是 依附 在 论 元 结构 之 上 的 
否定 关系 、 模 态 关 系 、. 时 体 关 系 、 称 代 关 系 和 指示 关系 ,主要 涉及 和 否 
定 算 子 、 模 态 算 子 和 时 体 算 子 跟 受 其 约束 的 成 分 之 间 的 逻辑 语义 
关系 ,还 有 代词 和 指示 词 跟 其 先行 语 之 间 的 照应 关系 。 可 以 分 述 
如 下 : 

(1) 在 现代 汉语 中 ,和 否定 算 子 (negative operator, 简写 为 neg) 主 
要 是 副词 “不 ?和 "* 没 没有 ”。 为 了 方便 ,助动词 “ 别 、 走 ”也 可 以 算 进 
去 。 在 书面 性 较 强 的 文体 中 ,有 时 会 用 到 “未 ”等 副词 。 当然 ,文言 色 
彩 较 重 的 “ 弗 、 勿 、 毋 、 莫 ?等 ,偶尔 也 会 用 到 。 

《2) 模 态 算 子 (modal operator ,简写 为 mod) 主要 是 表示 情态 的 
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助动词 ,常见 的 有 "能 、 能 够 可以、 会 .可 能 、 得 (de) 、 敢 . 肯 、 愿 意 、 情 
愿 、. 乐 意 ` 想 .要 ,. 当 应 .该 .得 (dai) .应 该 应当,. 许 、 准 .值得 . 配 ? 等 。 
副词 “必须 一定 ?等 也 可 以 算 进 去 。 

《3) 时 体 算 子 包括 “将 、 刚 、 刚 刚 . 已 经 .曾经 、. 又. 再. 正 \ 在 、 正 
在 ”等 时 间 副 词 “着 、 了 、 过 ”等 时 态 助 词 “ 了 、 呢 .着呢 、 来 着 、 来 的 ” 
等 语气 词 。 其 中 将 .即将 .再 等 表示 将 来 时 (future tense, 简写 为 
fut2， 刚 、 刚 刚 、 已 经 .曾经 .又 ”等 表示 过 去 时 (past tense, 简写 为 
past); 着 、 呢 着 呢 、 正 .在 、 正 在 ”表示 进行 体 (progressive aspect， 
简写 为 prog) ,助词 “了 ”和 语气 词 “ 了 ”表示 完成 体 (perfect aspect， 
简写 为 perf) 交 来 着 ,来 的 ?最 近 的 过 去 发 生 的 事 ; 相 当 于 现在 完成 体 
(present perfect, 简 写 为 pres-perf) ,过 ”表示 经 历 体 , 相 当 于 过 去 完 
成 体 (past perfect, 简写 为 past-perf) 。 

《4) 代词 包括 “我 . 咱 、 你 \ 您 .他 (她 、 它 ) 我们 、 咱 们 、 你 们 、 他 们 
(她们 、` 它 们 ) 大 家 自己 ?等 人 称 代词 。 

《5) 指示 词 包括 “这 、 那 .这 里 (这 儿 )、 那 里 (那儿 ) 、 这么、 这样、 
那么 .那样 ,这么 样 . 那 么 样 ?等 指示 代词 ,文言 词 “ 此 ”和 包括 “此 ”的 
词语 也 可 以 算 进 去 。 另 外 , 像 * 昨 天 、 今 天 .明天 此前、 此后、 此 外 、 同 
年 、 同 日 .同时 ?等 相对 性 时 间 词 ,它们 不 表示 绝对 的 时 间 , 只 有 根据 
话语 中 某 个 具体 的 时 间 来 确定 其 所 指 , 也 属于 指示 词 ,。 


3.2 逻辑 语义 关系 的 标注 规范 


我 们 约定 ,表示 逻辑 语义 关系 的 词语 都 用 尖 括 号 套 起 来 ,在 括号 
外 加 上 语义 功能 的 标志 。 这 一 层面 的 标志 ,一 律 用 小 写字 母 组 成 的 
简称 。 具 体 地 说 , 约 有 六 项 内 容 : 

(1) 在 否定 算 子 之 后 一 律 加 上 neg 作 标志 ,并 用 花 括 号 标志 其 
辖 域 。 例 如 : 

a. [军队 人 数 ]m( 国 )。e{( 得 ?ou{ 超 过 [全 国人 已 营 娄 的 
开放 
b.， 偏偏 (1995 下 半年 }r{ 玉 环岛 上 )}[ 滴 水 ]m 《二 半 e(T) 


280 基于 认 知 的 汉语 计算 语言 学 研究 


(2) 在 模 态 算 子 之 后 一 律 加 上 mod 作 标 志 ，, 并 用 花 括号 标志 其 
辖 域 ;这 样 ,不 仅 标明 了 其 所 支配 的 动词 性 成 分 的 范围 ,而 且 还 标明 
了 花 括 号 中 的 语言 表达 在 情态 上 表示 的 是 一 种 非 现 实 的 断言 (irrea- 
lis assertion) 。 例 如 : 


a. [领导 ]A( 要 ?aoa 伍 与 运动 员 、 教 练 员 ]np 滚 在 [一 块 ]Le 


可 能 )。o{(( 会 )ooa{ 下 达 [ 撤 换 其 职务 的 命令 ]p}} 。 
(3) 在 各 种 时 体 算 子 之 后 ,分 别 加 上 不 同 的 时 体 标记 。 例 如 : 
a. 《前 几 天 }T,[ 我 ]s 还 看 望 ( 村 pea[ 张 文康 先生 四 
b. 【俄国 防 部 和 总 参谋 部 ]A{ 在 过 去 10 年 中 )， 一 直 )pos 
《在 ms 激烈 争夺 [军事 行动 和 军队 经 费 掌 管 权 。 
必 v [ 列 希 ]Px 《 曾 放 贡 计 连 续 担任 (过 pasrpet[ 十 届 议 员 ]ne 


(4) 在 代词 或 指示 词语 之 后 加 上 下 标 ( 依 次 为 i，j， k,…) ,并 在 
其 先行 语 (或 参照 性 词语 ) 之 后 加 上 相同 的 下 标 ,来 显示 同 指 (Ccoref- 
erence) 或 索引 (indexing) 关 系 。 我 们 约定 : @ 当先 行 语 是 整个 论 元 
时 ,由 于 不 会 引起 歧 解 ,因而 不 用 加 下 划 线 ;@) 当先 行 语 嵌 在 一 个 词 
组 之 中 时 ,为 了 明确 ,需要 在 先行 语 之 下 加 下 划 线 ;G@) 当先 行 语 是 一 
个 超出 一 个 论 元 范围 之 外 的 复杂 词组 或 小 句 、 甚 至 复句 、 段 落 时 ,为 
了 辨认 的 方便 ,用 花 括 号 把 先行 语 套 起 来 ,并 在 括号 后 面 加 上 下 标 。 
图 当先 行 语 不 止 一 个 、 代 词 或 指示 词 是 复数 形式 时 ,代词 或 指示 词 
之 后 的 几 个 下 标 用 加 号 连接 。@ 相反 ,当代 词性 成 分 的 所 指 跟 先行 
语 只 是 一 种 部 分 关系 时 ,依次 在 这 种 部 分 代词 的 照应 下 标 后 面 加 数 
字 (1，2，…) 作 标记 。@ 对 于 先行 语 不 明确 的 代词 或 指示 词 , 用 问 
号 作 下 标 。 例 如 : 


a。 [ 博 塔 ;]ex《 曾 ms 任 [ 旧 南非 的 国 防 部 长 、 总 理 和 总 
统 ]ge,[ 他 ; 掌握 的 重要 情况 ]m{ 对 真相 委员 会 完成 其 使 命 }ge 至 
b.!{(1940 年 江 月 )T [中 共 北 方 局 ]A 决定 [[ 太 冀 地 区 im 成 
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为 [独立 的 战略 区 jg，Le]aA 成 立 [ 太 岳 区 党 委 jR,[ 安 子 文 同 
志 ]x 任 [ 书 记 ]。 ]se。{ 同年 这 月 19 日 jz,[ 陈 广 同 志 ]^ 奉 [ 和 八 
路 军 总 部 命令 ] 率领 [八路 军 三 八 六 旅 ]kgA 进 驻 [ 太 需 区 小 。 

C。 {[ 彬 县 工商 局 ]m{ 竹 直上 划 过 程 中 }r, 存 在 [C[e]A 严 
重 违规 [elj]A 突击 进 人 [70 多 名 jg 和 [领导 干部 ]A 弄虚作假 、 
以 权谋 私 的 ) 问 题 ]w js,[ 对 项 。]w[ 张 定 会 ]m 负 有 [直接 领导 责 
任 ]e。 

d. 《在 成 立 大 会 上 }),[ 和 白 滨 一 良 i sx 被 [Ley]a 选 为 E 代 
表 jge,[ 木 庭 健 太 邹 ex 被 [ey js 选 为 [干事 长 je。 [他 4 二 都 
《 曾 yw 扯 任 [ 原 公明 党 副 书记 ]we。 

e. {1995 年 jxf{(L 杨 光 让 mx 上 任 ) 后 不 久 }T 针 许多 人 ]A 便 主 
动 找 上 [ 门 上 来 ， [有 的 is 拉 [ 他 iptA 合 伙 做 [生意 jP,[ 有 
的 由 《起 )u{[ 找 [他 ,]eA 做 [靠山 ]]w)。 


在 例 e 中 ,部 分 代词 “有 的 ? 指 人 或 事物 中 的 一 部 分 ,其 先行 词 是 上 文 
的 “许多 人 ”。 两 个 有 的 ?的 所 指 可 以 一 样 ,也 可 以 不 一 样 ;因此 ,在 
下 标 上 加 不 同 的 数字 以 示 区 别 。 

《6) 为 了 跟 先 行 语 建立 尽 可 能 对 等 的 同 指 或 其 他 照应 关系 ,可 
以 把 照应 下 标 加 在 由 代词 或 指示 词 所 组 成 的 词组 后 面 , 即 整个 这 个 
词组 跟 先 行 语 具 有 照应 关系 。 例 如 : 


a. [ 黄 赛 红 ]Agk… , (于 1996 年 7 月 5 应 毕业 。 { 也 }ADD 就 

这 个 月 。}r,[ 陈 云 峰 |] 调 到 [ 沙 善 办 事 处 ]iei [e] 避 当 
ENE3 

b. [ 重 依 斯 的 僚 职 imm 受 到 [各 方面 欢迎 je。 [一 些 大 士 ]s 
认为 ,[[ 匡 糙 币 )]m( 可 以 oa 作对 公正 解决 属 杀 惨 案 , 推 动 政府 
与 该 州 游击 队 组 织 萨 帕 塔 民族 解放 军 恢复 和 读 ]ie ,产生 [积极 
影响 jR)]Re。 

为 了 使 指示 性 词语 跟 先 行 语 “1996 年 7 月 ”和 ”和 鲁 伊 斯 的 辞职 ?在 语 


义 照应 关系 上 的 一 致 ,把 照应 标记 分 别 加 在 整个 指示 性 短语 “这 个 
月 ?和 "这 样 做 ?之 后 。 
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4 篇 章 语 义 关 系 的 标注 及 其 规范 


4.1 篇 章 语义 关系 和 篇 章 关联 词语 


篇 章 语义 涉及 篇 章 中 词 .短语 和 句子 语义 之 外 的 意义 问题 , 主 
要 有 三 个 方面 : (1) 话语 的 连贯 , 指 前 后 句子 之 间 在 语义 上 的 联系 ， 
包括 前 后 命题 之 间 的 因果 、 条 件 背景、 限定、 补充 .解释 等 意义 关系 ， 
在 形式 上 则 是 通过 语序 .连词 等 语法 或 词汇 手段 来 指示 句子 之 间 在 
语义 上 的 联系 。 这 是 一 种 语 篇 的 局 部 连贯 (local coherence)。 (2) 
信息 分 布 , 指 新 旧 信 息 在 语 篇 中 的 表达 方式 和 话语 功能 。 话 语 的 信 
息 结 构 有 话题 和 说 明 两 个 部 分 ,前 者 表示 已 知 信息 ,以 此 同上 文 相连 
接 , 后 者 表示 新 信息 ,以 此 推动 话语 的 展开 。 它 们 可 以 在 句子 中 表现 
为 不 同 的 句子 成 分 ,也 可 以 在 句 群 中 表现 为 不 同 的 句子 。 比 如 ,话题 
在 英语 句子 中 可 以 由 作 主 语 的 非 重 读 的 定 指名 词 或 代词 担任 ,在 句 
群 中 则 可 以 由 位 于 句 群 开头 的 从 属 小 名 担任 。(3) 总 体 连贯 (global 
coherence) , 指 语 篇 从 头 到 尾 的 总 体 连 贯 ,体现 为 语 篇 的 宏观 结构 
(macrostructure) 。@ 也 就 是 说 ,篇 章 语 义 以 意义 连贯 (coherence) 为 
中 心 , 要 求 表层 篇 章 背 后 所 指 的 篇 章 世界 (textual world) 中 的 每 一 
个 概念 和 关系 都 必须 是 相连 的 和 相关 的 。 这 种 意义 连贯 又 是 通过 形 
式 连贯 (cohesion) 来 实现 的 ,体现 为 通过 各 种 形式 .意义 手段 来 使 一 
个 篇 章 中 的 各 构成 成 分 相互 有 联系 ;比如 ,词语 的 重 现 或 部 分 重 现 、 
相同 结构 的 并 列 内容 的 复述 \ 词 语 的 称 代 和 省 略 、. 时 体 成 分 、. 连 接 成 
分 “话题 一 说 明 ” 类 信息 结构 .甚至 特定 的 语调 等 超 音 段 成 分 (su- 
prasegment) 。 要 而 言 之 ,一 个 语 段 之 所 以 是 篇 章 ( 而 不 是 非 篇 章 ) 就 
在 于 其 有 篇 章 组 织 性 (texture); 而 篇 章 组 织 性 是 建立 在 各 种 连贯 关 
系 (Ccohesive relation) 上 的 ,这 连贯 关系 一 方面 使 得 对 篇 章 中 某 些 成 
分 的 解释 需要 依靠 其 他 成 分 才 得 以 进行 , 另 一 方面 又 是 通过 连接 成 


@ 主要 根据 van Dijk (1985) 的 有 关 见 解 ,中 文 介绍 详 见 陈 平 (1991)? 第 83 一 84 页 。 
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分 、 指 称 、 替 代 、 省 略 和 词义 联系 等 来 实现 的 . 

目前 ,语言 学 界 对 篇 章 语义 的 研究 还 不 成 熟 ,而 且 理 论 见 解 多 所 
分 歧 。 但 是 ,根据 上 文 $1 的 说 明 , 篇 章 语义 关系 主要 是 骑 跨 在 不 同 的 
论 元 结构 之 上 的 各 种 衔接 关系 (cohesion) ,诸如 并 列 .选择 : 递 进 .连贯 、 
转折 、` 因 果 、 假 设 、 条 件 、 目 的 .解释 .承接 ` 反 意 `\ 总 结 等 关系 。 主 要 涉 
及 到 各 种 关联 词语 及 其 所 表示 的 篇 章 关系 。 另 外 , 像 话题 一 说 明 这 种 
语 用 平面 上 的 意义 关系 ,对 篇 章 组 织 和 篇 章 语义 也 起 作用 。 至 于 代 
词 .指示 词 和 省 略 等 手段 ,当然 对 篇 章 组 织 和 篇 章 语 义 也 起 作用 ;只 是 
上 文 已 经 在 放 在 论 元 结构 层面 上 作 了 处 理 了 ,这 里 就 不 再 重复 。 

在 现代 汉语 中 ,表示 小 句 或 句子 之 间 的 语义 关系 的 词语 主要 是 
连词 .关联 副词 等 。 下 面 列 出 主要 的 篇 章 关 系 和 相应 的 关联 词语 、 及 
其 缩写 标记 : 


(一 ) 承 接 性 关系 
(1) 并 列 关系 (coordinate, 简 写 为 COR) ,例如 :也 、 还 、 又 、 
间 腑 司 前 申 斋 汪 果 两 (DP2 过 攻 糙 -过 eof 绞 生 


《2) 递 进 关 系 (additive，, 简 写 为 ADD) ,例如 :还 `. 进 而 ` 再 
说 、 再 者 何况 、 况 且 、 乃 至 甚至 .不 但 /不 仅 /不 止 / 不 光 / 不 独 / 


不 单 /非但 /非特 …… 而 且 / 并 且 ……? 等 。 

〈《3) 选择 关系 (alternative, 简写 为 ALT) ,例如 :或 、 还 是 、 或 
者. 哑 - 汪 二 考 : 5 要 区 要 榴 持 必 ;于 用: 击 二 就 曲张 3 
宁肯 /宁愿 .…:… 是 《 滋 唱 于 诲 蒿 人 宁可 / 宁 青 / 宁 题 :时 2 等 

(4) 连贯 关系 (temporal, 简写 为 TEM) ,例如 :首先 
氏 滞 已 志 -接着 5 虹 后 史 扣 2 枚 

(二 ) 条 件 性 关系 

(5) 条 件 关 系 (conditional ,简写 为 CON) ,例如 : “只 要 
就 ……- \、 只有.……， 才 ……-。 \ 不管 /不 论 / 无 论 / 任 任 :…… 都 .……- 除 
非 ”等 。 


(6) 因果 关系 (causal, 简写 为 CAS)， 例 如 :“ 因 此 、 因 


@ 主要 根据 de Beaugrande & Dressler (1981) 和 Halliday & Hasan (1976) 、Brown 了 & 
Yule (1983: 190 一 194) 的 有 关 见 解 ,中 文 介 绍 详 见 雇 秋 忠 (1992) 第 373 一 376、399、402 页 。 
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(7) 假设 关系 (suppositional, 简写 为 SUP) ,例如 :“ 如 果 / 
假如 /假使 /要 是 .pp: 那么 /就 ……… 二 号 让 地 、 否 则 ”等 。 

(8) 转折 关系 (adversative, 简 写 为 VER) ,例如 :而 、 却 \ 反 
之 、 相 反 地 、 有 虽然.…… 但 是 /可 是 /然而 /不 过 …… ”等 。 

(9) 目的 关系 (purposive，, 简 写 为 PUR)， 例 如 : “为 了 、 以 
便 、 以 免 、 省 得 ”等 。 


其 中 ,并 列 、 递 进 . 选 择 和 连贯 这 四 种 关系 ,基本 上 表示 几 个 命题 
之 间 的 合 取 关 系 (conjunction) 或 析 取 关系 (disjunction), 其 中 的 每 
一 个 命题 都 是 合 取 枝 (conjunct) 或 析 取 枝 (disjunct) 可 以 简称 为 选 枝 
(junct, 记 作 JUN) 。 而 条 件 、 因 果 、 假 使 .转折 和 目的 这 五 种 关系 , 基 
本 上 表示 两 个 命题 之 间 的 “条 件 一 结果 ”关系 , 即 列 涵 关 系 (implica- 
tion) 。 比 如 ,条 件 关 系 的 前 件 表示 条 件 (condition, 简 写 为 CON) ,后 
件 表 示 结 果 (consequence 简写 为 CSQ) 。 因 果 关 系 的 前 件 表 示 原 因 
(cause, 简 写 为 CAS) ,后 件 表示 结果 。 假 设 关 系 的 前 件 表示 假设 的 
条 件 (supposed condition ,简写 为 SUP) ,后 件 表示 结果 。 转 折 关 系 
的 前 件 表 示 让 步 性 条 件 (concessive condition ,简写 为 CES) ,后 件 表 
示 结 果 ; 为 了 明确 和 区 别 , 转 折 关 系 的 后 件 标记 为 转折 , 即 用 VER 
作 标 志 。 目 的 关系 由 “手段 一 目的 ”两 个 命题 组 成 ,目的 命题 表示 目 
的 性 条 件 (purposive condition, 简写 为 PUR) ,手段 命题 (means, 简 
写 为 MEN) 表 示 这 种 目的 指导 下 的 结果 。 

- 其 他 常用 的 语 篇 标志 词语 ,如 “例如 、 举 一 个 例子 .比方 说 、 换 一 
句 话说、 也 就 是 说 .如 前 所 述 .至 于 .总 之 可见、 一 句 话 、 显 而 易 见 . 诸 
如 此 类 ?等 ,也 可 以 归 人 连贯 关系 。 

对 于 语义 标注 工作 来 说 ,对 这 种 语 篇 关联 词语 (text conjunc- 
tives) 及 其 表示 的 语义 关系 进行 标注 ,是 比较 现实 的 。 因 此 ,我 们 把 
重点 放 在 这 一 方面 。 


4.2 篇 章 语义 关系 的 标注 规范 
(1) 为 了 显示 语 篇 中 的 语义 连贯 关系 ,可 以 把 副词 “ 先 . 并 ”、 连 
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词 “ 然 后 \ 但 是 ”等 能 把 小 句 、 句 子 、 甚 至 段落 等 较 大 的 语言 单位 连接 
起 来 ,使 之 成 为 句子 .话语 .甚至 篇 章 的 词语 或 其 他 表层 结构 上 的 词 
汇 特 征 , 笼统 地 叫做 话语 衔接 词语 (cohesive expression, 简写 为 
COH) 。 所 有 的 语 篇 标记 ,一 律 用 大 写字 母 。 当 话语 衔接 词语 同时 
是 论 元 性 成 分 时 , 语 篇 功能 标记 加 在 论 骨 和 角色 标记 的 后 面 ,中 间 用 合 
取 号 & 连接 。 例 如 : 


{1954 年 jjfy[L24 岁 的 梁 惠 珍 ie 开始 人 二 eued[ 行 医生 涯 je。 

[她 ; ]^ ({ 大 )raw 是 { 在 一 个 县 卫生 所 六 工作 ， Eei je 

(项 琳 )rerewi 成 为 [海南 省 屯 昌 县 人 民 医院 的 妇 产 科 主 任 ]Re。 
像 上 例 中 的 “后 来 >, 既 是 时 间 论 元 ,又 是 表示 连贯 关系 的 语 篇 衔接 词 
语 。 

(2) 为 了 简单 ,对 于 单 用 的 “ 先 . 并 、 也 、 但 是 .果真 如 此 .总 而 言 
之 . 换 句 话说 ?等 承接 性 语 篇 关联 词语 ,用 花 括号 套 起 来 ,并 直接 在 其 
后 标注 其 语义 功能 。 当 有 关 的 语 篇 衔接 词语 的 语 篇 功能 不 明确 时 ， 
径直 标 上 COH; 这 一 点 ,在 其 他 地 方 也 适用 。 例 如 : 


a. (1994 年 j7 针 黄 赛 红 门 wswse 考 取 ( 了 )uat[ 浙 江 省 政法 管 
理 干部 学 院 jprgwvr,[ejsx{ 通 过 三 年 的 自 费 脱产 学 习 }vy{ 于 
1996 年 7 月 sj 毕业 。 { 也 }cog 就 { 在 这 个 月 ijr,[ 陈 云 峰 ;je 
{ 因 出 色 的 工作 成 绩 }sa{ 从 城关 镇 内 设 机 构 青 马 办 事 处 }jrcs 调 
到 [ 沙 善 办 事 处 je [eiJex 当 [ 副 主任 je。 

b. [南非 真相 委员 会 副 主 席 伯 瑞 恩 ]A{ 同 日 jz 呼吁 ， 
[[ 他 :] 硕 望 ([[ 博 塔 ]A( 能 )su{{ 在 最 后 一 刻 )r 改变 [态度 ]， 
[si ]s。 同 意 LEs 了 到 [真相 委员 会 ] 作 证 Re)} je }k jne。 
{ 果 真如 此 。)}cobrsup,[ 真 相 委 员 会 ] (将 )iu 建议 [[ 卡 因 ]^ 撤 
诉 ]Re。 [请 塔 j]ee( 曾 ?ms 任 [ 旧 南 非 的 国防 部 长 .总理 和 总 统 ]se， 
[他 ; 掌握 的 重要 情况 Ju { 对 真相 委员 会 完成 其 使 命 } 愉 至 关 重 
要 。[ 真 相 委 员 会 ]\( 曾 )us 3 次 传 唆 [[ 他 i]A 到 场 听证 ]w， 
{ 人 得 )veg[ 他 i]A 均 { 以 有 病 等 理由 }jm 拒 绝 [出 席 ]P,[Le]A{ 蔗 }Anpp 
指责 [[ 真 相 委 员 会 的 工作 ]m 是 [“ 马 戏 团 表 演 " 和 “政治 所 
害 ” 不 后 。 
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在 例 b 中 ,如 果 能 肯定 “果真 如 此 ?的 语义 功能 是 表示 假设 ,那么 标 上 
SUP; 如 果 拿 不 准 ,就 退 一 步 标注 其 上 位 功能 COH。 

(3) 对 于 “ 先 ……: 然后 ……* 、 或 者 …… 或 者 ……- ”等 前 后 相 呼 应 
的 表示 承接 性 关系 的 关联 词语 ,用 花 括号 把 成 对 的 关联 词语 分 别 套 
起 来 ,然后 分 别 在 花 括 号 后 面 标 上 其 语义 功能 ,并 加 上 相同 的 下 标 ， 
以 示 它 们 之 间 的 前 后 配套 关系 。 例 如 


[他 上 A{ 先 )rewi{ 从 日 本 }ies 进 口 [原装 马 自 达 323ij 至 { 香 
港 jieo,[e]A 就 地 拆散 [sjp,{ 按 配件 ju 报关 进口 。 
{ 然 后 }rewi,{ 得 }rewi[ 由 广东 \ 广 西 、 湖 北 ` 四 川 等 地 的 汽车 修 
配 厂 ]A[ 将 它们 j] 组 装 成 [车 ]R。 


(4) 对 于 “因为 ……: 所 以 .…… 、 如 果 .……- 那 交 :sn 、 只 要 o 者 
就 ……… “等 前 后 相 呼应 的 表示 条 件 性 关系 的 关联 词语 ,或 者 (用 花 括 


号 把 成 对 的 关联 词语 分 别 套 起 来 ,然后 分 别 在 花 括号 后 面 标注 其 语 
义 功 能 ,并 加 上 相同 的 下 标 , 以 示 它 们 之 间 的 前 后 配套 关系 ;或 者 (分 
别 用 花 括 号 把 其 所 关联 的 小 名 或 句子 套 起 来 ,然后 分 别 在 花 括号 后 
面 标注 条 件 (CON) 和 结果 (CSQ) 等 语义 功能 ,并 在 关联 词语 下 面 加 
着 重点 。 例 如 : 


a。 其 实 [大 家 ]A{ 如 时 }suei 认 真 地 读 一 读 [ 我 在 两 次 新 闻 
发 布 会 上 所 披露 出 来 的 中 国 卫 生 工 作 存 在 的 各 方面 问题 ]， 
(就 }csai( 能 ?aoa{ 品 味 出 [ 张 文 康 工 作 中 存在 的 失误 je)} 。 

a?。 其 实 {[ 大 家 ]A 如 果 认 真 地 读 一 读 [我 在 两 次 新 闻 发 布 
会 上 所 披露 出 来 的 中 国 卫生 工作 存在 的 各 方面 问题 je }supi,{ 就 
《能 > 品味 出 [ 张 文 康 工 作 中 存在 的 失误 jejcsai。 

b. [ 府 堪 国 ; 的 职务 jswvrh{ 晶 }crsi( 已 mst 升 为 [分 管 户 籍 、 
外 勤 的 副 所 长 ]w.,{ 狼 }veni[ 他 ,]。 还 是 {“ 按 照 原来 的 那样 jw 做 
LPROJjwg”,[e]A 经 常 深 入 [ 辖 区 下 ,[ei]A{ 为 实现 辖区 发 案 少 、 
秩序 好 、 群 众 满意 )A 而 努力 。 

b?， 人 {[ 闻 域 国 ; 的 职务 ]svwm 唱 《 已 mse 升 为 [分 管 户 籍 、 外 勤 
的 副 所 长 jge jcgsi， { 移 [他 ]A 还 是 人 按照 原来 的 那样 }w 做 
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[PROJ]awR>”，[eiA 经 常 深入 [ 连 区 小 , [ea{ 为 实现 辖 区 发 案 U 汉 
秩序 好 、 群 众 满意 }Ai 而 努力 } veni。 


第 中 种 标记 方案 的 优点 是 简洁 ,缺点 是 关联 词语 所 领 辖 的 小 句 或 名 
子 的 界限 不 清楚 ;第 @ 种 标记 方案 的 优点 是 关联 词语 所 领 辖 的 小 句 
或 句子 的 界限 很 清楚 ,缺点 是 碰 到 多 重复 句 等 复杂 的 句子 或 句 群 时 ， 
括号 繁多 ,反而 模糊 了 层次 关系 。 

《5) 汉语 中 有 一 种 无 根 话题 名 (dangling topic sentence) ,0 其 各 
首 话 题 跟 说 明 部 分 中 的 谓语 核心 没有 论 元 结构 关系 。 显然 ,这 种 名 
子 中 的 话题 成 分 无 法 从 说 明 部 分 中 的 谓语 核心 上 得 到 论 旨 角 色 , 结 
果 使 得 我 们 无 法 标注 其 论 则 角色 。 碰 到 这 种 情况 ,首先 用 花 括号 界 
定 这 两 个 成 分 的 范围 ,然后 分 别 在 后 面 标注 话题 (topic, 简写 为 
TOP) 和 说 明 (comment, 简写 为 COMD) 这 种 话语 结构 关系 ,最 后 在 说 
明 部 分 内 部 再 标注 其 中 的 论 元 成 分 相对 于 谓语 核心 的 论 旨 角 色 。 例 
如 : 


3- 《该 剧 }rop 人 [情节 Jm 曲 折 ,[ 感 情 纪 葛 ]cu 让 [人 ]pss 回肠 
注 各 oo 
b，{ 人 宝马? 假 彩 案 )rop : 人 陕西 体彩 中 心 主任 贡 安 庆 ] 被 
[siJ]A 撤职 }cow。 
这 样 , 可 以 让 文本 中 的 每 一 个 名 词性 成 分 都 能 得 到 一 个 论 旨 角色 或 
话语 功能 角色 标记 。 


5 语义 关系 标注 语料库 的 应 用 


5. 工 从 语义 依存 树 到 句法 关系 树 

根据 上 述 语义 标注 体系 及 其 规范 ,我 们 就 可 以 建造 带 有 语义 关 
系 标记 的 语料库 , 即 一 种 经 过 语义 关系 分 析 的 语料库 。 由 于 语义 关 
系 是 超越 于 树 形 结构 的 网 络 结构 ,因而 这 种 标注 了 语义 关系 的 语 料 


@ “关于 无 根 话 题 句 , 详 见 Shi (2000) 。 
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库 应 该 是 一 种 网 库 Cnet bank) 。 但 是 ,如 果 着 眼 于 谓词 性 成 分 跟 其 
论 元 成 分 之 间 的 论 旨 和 角色 关系 ,舍弃 其 他 方面 的 一 些 语 义 细节 ; 那 
入, 就 可 以 从 句子 的 论 旨 角色 标记 上 自动 地 建立 起 一 棵 扁平 形状 的 
语义 依存 树 Cdependency tree) 。 其 大 概 的 方法 是 : (iD 首先 建立 句 
子 节点 S,(ii) 然后 把 充当 谓语 核心 的 动词 性 成 分 提 到 直属 于 S 的 
子 节点 VP,(iii) 最 后 把 一 个 个 论 元 作为 叶子 节点 连接 到 VP 节点 
上 。 当 然 , 论 元 成 分 中 也 可 以 包含 动词 性 成 分 ,其 本 身 也 可 以 是 一 棵 
依存 树 ,从 而 形成 依存 树 的 递归 结构 。 这 种 扁平 形状 的 语义 依存 树 
还 可 以 转换 成 有 深度 的 句法 结构 树 。 其 大 概 的 方法 是 : (iD) 首先 ,如 
果 充 当 谓 语 核心 的 动词 性 成 分 之 后 有 论 元 成 分 ,那么 把 充当 谓语 核 
心 的 动词 性 成 分 跟 紧邻 其 后 的 论 元 成 分 构成 述 宾 关 系 ; 如 果 这 个 述 
窒 结 构 之 后 还 有 论 元 成 分 ,那么 这 个 述 宾 结 构 再 跟 其 后 的 这 个 论 元 
成 分 构成 复杂 的 述 宾 关 系 ( 双 宾 语 结构 ); (ii) 然后 ,从 这 个 复杂 的 述 
宾 结 构 依 次 向 前 , 跟 其 前 面 各 个 无 介词 引导 的 论 元 成 分 渐次 构成 层 
层 嵌 套 的 主 谓 关 系 , 跟 其 前 面 各 个 有 介词 引导 的 论 元 成 分 渐次 构成 
层 层 嵌 套 的 偏 正 关系 。 再 考虑 得 复杂 一 点 ,(i) 首先 ,把 充当 谓语 核 
心 的 动词 性 成 分 后 面 的 体态 算 子 跟 这 个 动词 性 成 分 构成 附加 关系 ， 
(ii 然后 ,依次 向 前 , 跟 这 个 复杂 的 动词 结构 前 面 的 各 个 时 体 算 子 或 
否定 算 子 渐次 构成 偏 正 关系 ,并 跟 这 个 复杂 的 动词 结构 前 面 的 各 个 
模 态 算 子 渐 次 构成 述 宾 关 系 。 当 然 , 这 种 句法 树 可 能 仍然 是 不 完整 
的 ,因为 在 语义 关系 标注 时 ,对 于 方式 性 成 分 没有 作出 标记 。 为 了 名 
法 分 析 的 完整 ,可 以 默认 这 些 没有 标记 的 方式 性 成 分 都 是 状语 ,依次 
跟 其 后 的 谓词 性 成 分 构成 偏 正 关系 。 这 样 ,这 种 句法 树 就 基本 完全 
了 。 为 了 节省 篇 幅 , 图 解 从 略 。 

可 见 , 通 过 基于 论 元 结构 的 语义 标注 路 线 ,不仅 可 以 把 语义 关系 
标注 可 能 带 来 的 语义 网 库 , 有 效 地 简化 为 一 种 扁平 的 依存 树 库 ;还 可 
以 从 这 种 语义 关系 库 中 抽取 出 一 棵 棵 句法 树 , 从 而 把 语义 树 库 还 原 
为 句法 树 库 ,直接 建立 起 语义 结构 和 名 法 结构 之 间 的 映射 关系 。 


5.2 语义 关系 标注 语料库 的 作用 
标注 了 上 文 所 述 的 三 种 层面 的 语义 关系 的 语料库 ,可 以 为 信息 
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抽取 提供 强大 的 语义 资源 。 比 如 ,在 一 定 程 度 上 , 论 旨 角色 对 应 于 信 
息 抽取 模板 上 的 模板 元 素 , 论 元 之 间 的 论 旨 角色 关系 对 应 于 模板 元 
素 之 间 的 事件 关系 ;而 否定 、. 时 体 、 模 态 语义 可 以 对 命题 所 表示 的 事 
件 的 类 型 和 及 其 真实 性 作出 约束 ,篇 章 关系 又 可 以 对 代词 和 指示 词 
的 所 指 求解 提供 帮助 .中 更 进一步 ,这 种 语料库 为 机 器 学 习 和 自动 
地 识别 句子 各 成 分 之 间 的 语义 关系 ,特别 是 对 于 机 器 学 习 和 自动 地 
发 现 篇 章 知识 ,提供 十 分 精炼 的 训练 语 料 。 例 如 : 
a.。 [ 邢 云 jz，{(1552 车 )> 生 ，[ejesLVJ][L 大 学 文化 ]we。 
[eijex 历 任 [ 内 蒙古 伊 克 胎 盟 副 盟 长 . 盟 委 副 书记 、 盟 长 ]Re， 
[e]。 (是 曙 .10 月 起 }- 任 [ 盟 委 书记 、 盟 人 大 工 委 主任 je。 : 
b.[ 罗 多 尔 佛 。 塞 尔 特 扎 。 塞 维 里 诺 ]ex{ 国 团 )r*{ 在 雅 加 
达 ) 正式 就 任 [东南 亚 国家 联盟 (东盟 ) 新 一 任 秘书 长 ]ge。[ 塞 
维 里 诺 i]es{ 于 |)r{ 在 吉隆 坡 召 开 的 第 三 十 局 东盟 外 长 
会 议 | 上) 被 Le]A 任命 为 [东盟 秘书 长 ]Re。 [他 ; 的 任期 ]m 
《将 at{ 于 二 OO 二 年 } 结束 。 [ 塞 维 里 诺 ; ]m 是 [菲律宾 的 一 这 位 
外 交 家 ]m ,[es]ee《( 荫 )。 先 后 担任 [ 菲 律 袜 驻 美国 、 中 国 和 马 来 
西亚 等 国 的 外 交 使 节 ]w 。({ 吕 现 现 “为 天 疙 第 间 )r,[ 塞 维 
里 诺 ;jex 任 [ 菲 外 交 部 副 部 长 ]s 和 二 责 [ 与 .东盟 有 关 的 事务 
等 ]we。 
c [阿尔巴尼亚 前 人 民 议 会 主席 团 主 席 列 希 ]es{ 一 日 晚 ) 
{ 在 地 拉 那 ) 病逝 ,[ 终 年 ]Jm[V][ 入 十 五 岁 ]Re。 [ 列 希 ;]m 且 
[阿尔 巴 尼 亚 反 法 西 斯 民族 解放 战争 中 的 杰出 人 物 ]。 烈 项 
订正 x《 管 >。 si 连续 担任 (过 pseped[ 十 一 届 议 员 ]，[ei]sx{ 并 
{ 在 一 九 五 三 年 至 一 九 八 二 年 期 间 }= 担任 [ 阿 巴 尼 亚 人 民 议 
会 主席 团 主席 国家 元 首 之 职 ]w。 
d. [ 尼 日 尔 警方 ]\{ 目前 ,) 破获 [一 个 (Lei]A 企图 暗 杀 
[ 返 纳 萨 拉 总 统 ] 的 ) 阴 谋 团 伙 i]。[ 尼 日 尔 通讯 社 ]A{ES 困 )” 


报道 说 ,[[ 被 摘 的 三 名 团伙 成 员 ]A 供认 ,[[ 他 们 上]A《( 顺 ws 定 


〇 @ 详 见 袁 航 林 (2005a，b) 。 
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[{ 于 考生 目 j 行动 jg。 针 上 暗杀 对 象 ]m{ 《 除 总 统 以 
外 } me ,还 包括 [ 几 名 政府 重要 成 员 ] ]Re]e。 ( 据 报道 ju,[ 该 瞳 
杀 团 伙 | 的 主谋 ]m 是 [ 哈 马 。 阿 马 杜 ij]ws。[ 他 i]s: 现 任 [ 尼 ( 目 
尔 ) 反对 派 “社会 发 展 全 国运 动 " 总 书记 ]w,[e]s'{( 盖 宣 }* 
( 芒 )us 担 任 ( 逻 ?wsnen[ 政 府 总 理 ]ge。[ 警 方 ]A{ 一 目 )7 (加 ya 
巡捕 ( 状 )ws[ 哈 马 ， 阿 马术 |] {( 笑 }ven[ 他 i]A( 不 )oe{ 承 认 

[Les]m[ 跟 这 起 暗杀 活动 ]s 有 关 ]w},[e]A 称 [[ 自 己 i][ 补 
人 ] 诬陷]we。 


从 篇 章 结构 的 角度 看 ,生平 介绍 类 文本 通常 用 顺 叙 的 写作 手法 , 顺 次 
交代 主体 论 元 的 出 生 学习 、 工 作 、 任 职 经 历 等 事项 ;这 种 顺 叙 往往 要 
用 一 组 顺序 性 的 时 间 论 元 来 显 性 地 标志 ,如 例 a 中 的 “1952 年 …… 
1986 年 10 月 起 ……”。.“ 就 职 . 就 任 ” 等 担任 动词 的 后 续 句 往往 要 交 
代 获 任 的 经 过 等 情况 ， 即 整个 话语 下 采用 倒 令 的 手法 ;其 表层 标志 是 使 
用 送 序 性 的 时 间 词 语系 列 , 如 例 b 中 的 “五 日 …… 卖 年 也 前 部 六 2 和 
有 时 还 要 倒 氢 主体 性 论 元 在 过 去 的 任职 经 历 , 其 表层 标志 是 使 用 过 
去 时 标记 ”* 曾 (经 )”, 然 后 是 一 组 顺序 性 的 时 间 词 语 , 如 本 例 中 的 
“… pp 曾 …… 一 九 九 二 至 一 九 巨 七 年 间 …… ”。 例 ec 显示 , 计 告 类 文 
体 通常 要 用 倒叙 的 写作 手法 , 先 交 代 某 人 的 死亡 时 间 、 地 点 等 事项 ; 
然后 交代 该 人 的 生平 事迹 。 这 种 倒 氢 往往 要 用 ”“ 曾 ?等 表示 过 去 的 时 
体 算 子 来 显 性 地 标志 。 本 例 在 倒 氢 其 任职 经 历时 ,还 用 了 语 篇 关联 
词语 “并 ” 作 标 记 。 例 d 的 篇 章 结 构 比 较 复杂 ,基本 的 叙述 方式 是 顺 
令 ( weeiese 日 前 破获 ee 供认 ……… [0] 一 日 已 逮捕 aogsous ) ,但 是 
其 中 又 有 方 括号 中 的 插 叙 (…… 主谋 是 ……) ,在 插 令 中 因为 涉及 担 
任 事件 所 以 又 引出 倒叙 (…… 现 任 …… 过 去 曾 担任 过 ……)。 这 种 复 
杂 的 叙述 安排 ,在 表层 结构 上 都 有 时 间 论 元 或 时 体 算 子 作 形 式 标志 ; 
并 且 , 最 后 一 句 的 主体 论 元 转换 时 ,还 用 了 语 篇 关联 词语 “但 ”。 

可 见 , 高 层次 的 顺序 、 倒 人 氢 、 插 叙 等 篇 章 构 造 方 式 , 会 在 低层 次 的 
论 元 结构 .逻辑 结构 和 篇 章 关联 词语 上 露出 些许 蛛丝马迹 ,认真 地 总 
结 这 种 宏观 的 篇 章 结 构 的 表层 标记 ,将 有 助 于 机 器 自动 地 进行 文本 分 
类 ;当然 ,这 对 信息 抽取 时 的 事件 模板 类 型 的 匹配 ,也 将 有 约束 作用 。 
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6 结 语 


上 文 给 出 了 一 种 基于 论 元 结构 的 汉语 语义 关系 的 标注 体系 : 
《iD 以 谓词 的 论 旨 结构 为 基础 ,给 谓词 所 支配 的 各 个 论 元 标注 论 旨 
角色 ;ii) 给 附加 在 论 元 结构 上 的 否定 .时 体 和 模 态 算 子 等 逮 辑 成 分 
标注 语义 功能 及 其 辖 域 ,给 指 代词 标注 照应 关系 ;(iii) 给 联结 不 同 
的 论 元 结构 的 语 篇 衔接 词语 标注 篇 章 功能 及 其 配对 关系 。 为 这 三 个 
层面 上 的 各 种 语义 关系 设计 了 便于 记忆 的 标记 ,形成 了 一 套 可 扩充 
的 标记 集 (tag set) 。 并 且 ,为 各 种 语义 关系 的 标注 制定 了 比较 具体 
的 操作 规范 ,更 为 具体 的 细则 (specification) 有 待 于 在 更 大 规模 的 语 
料 标注 实践 中 逐步 形成 。 最 后 ,展示 怎样 从 经 过 上 述 语 义 标注 的 语 
料 上 自动 地 为 句子 建立 语义 依存 树 和 句法 关系 树 , 还 讨论 了 这 种 语 
料 库 在 信息 抽取 、 机 器 学 习 等 领域 的 运用 。 通 过 对 数 万 字 新 闻 文 本 
的 手工 标注 ,显示 出 这 套 标注 体系 对 真实 语 料 具 有 较 好 的 适应 性 和 
较 高 的 语义 关系 信息 的 覆盖 率 。 
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附录 
汉语 语义 关系 网 库 标记 集 
0 3 引 


这 套 汉 语 语义 关系 网 库 标 记 集 包 括 三 个 子 集 : 论 旨 角色 标记 
集 ` 逮 辑 关系 标记 集 . 语 篇 关系 标记 集 , 基 本 覆盖 谓词 性 成 分 的 论 元 
结构 .附加 在 论 元 结构 上 的 逻辑 语义 结构 、 联 结论 元 结构 的 话语 篇 章 
结构 三 个 层面 上 的 主要 的 语义 关系 。 这 套 标记 集 共 有 52 个 (54 个 
减 去 2 个 重复 的 ) 标 记 。 


1 论 旨 角 色 标 记 集 


串 


帮助 记忆 的 说 明 
agent 的 首 字母 
sentient 的 前 两 个 字母 
experiencer 的 前 两 个 字母 
causer 的 前 三 个 字母 
theme 的 前 两 个 字母 
patient 的 首 字 母 
dative 的 首 字 寻 
result 的 首 字 母 
target 的 前 两 个 字母 
relative 的 前 两 个 字母 
instrument 的 首 字母 
material 的 前 两 个 字母 
manner 的 首 字 母 
reason 的 首尾 字母 
aim 的 前 两 个 字母 
time 的 首 字 母 
location 的 首 字 母 
source 的 前 两 个 字母 


7 
弟弟 
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标记 代码 | 标记 名 称 帮助 记忆 的 说 明 
终点 goal 的 前 两 个 字母 

路 径 path 的 前 两 个 字母 
范围 range 的 前 两 个 字母 
话题 topic 的 前 三 个 字母 

说 明 comment 的 前 三 个 字母 


说 明 : (1) 论 旨 角色 的 标记 代码 ,采用 首 字母 大 写 的 方式 。 

论 旨 角色 的 标记 代码 , 尽 可 能 采用 语 和 由布 和 二 罗 二 
便 记 忆 和 人 工 标注 及 校对 。(3) 话题 和 说 明 本 来 是 话语 篇 章 结构 
层面 上 的 功能 性 成 分 ,因此 一 律 采用 大 写字 母 。(4) 在 我 们 的 标注 
体系 中 ,只 有 当 话 题 性 成 分 跟 后 面 说 明 性 成 分 中 的 谓词 没有 论 旨 和 角 
色 关 系 时 , 才 标 注 这 种 话语 功能 。 也 就 是 说 ,只 有 当 体 词 性 成 分 没有 
论 旨 角色 可 标注 时 , 才 用 话语 功能 角色 济 其 穷 ; 因 此 ,这 里 把 话题 .说 
明 暂 且 放 在 论 旨 角色 标记 集中 。 


2 逻辑 关系 标记 集 


标记 名 称 帮助 记忆 的 说 明 例 词 
否定 算 子 | negator 的 前 三 个 字母 不 、 没有、 未 
模 态 算 子 .| modality 的 前 三 个 字母 | 能 、 可以、 该 
future 的 前 三 个 字母 将 .即将 \ 快 
整个 英语 单词 Past 刚 、 已 、 曾 经 
progressive 前 四 个 字母 | 着 \ 呢 、 正 在 
perfect 的 前 四 个 字母 
| pres-perf 完成 5resent 的 前 四 个 字母 

past-perf 过 去 完成 体 | 过 去 完成 的 英语 缩写 


说 明 : 〈1) 逻辑 语义 关系 的 标记 代码 ,一律 采 用 小 写字 母 。 
逻辑 语义 关系 的 标记 代码 , 尽 可 能 采用 语言 全 全 
式 ,以 便 记 忆 和 人 工 标注 及 校对 。 
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6 


语 篇 关系 标记 集 


序号 | 标记 代码 | 标记 名 称 帮助 记忆 的 说 明 

并 列 关 系 | coordinate 的 前 几 个 字母 | 既 … 又 .… 、… 也 

2 并 列 选 枝 | 同一 下 标 表 示 同 一 关系 | 既 …、 又 …、 也 … 

3 ADD 递 进 关系 | additive 的 前 三 个 字母 不 但 … 而 且 … 

4 | ADD-i | 递 进 选 枝 | 同一 下 标 表示 同一 关系 不 但 ……\ 而 且 …… 

5 ALT 选择 关系 | alternative 的 前 三 个 字母 | 或 者 … 或 者 … 

6 |ALT-i | 选择 选 枝 | 同一 下 标 表示 同一 关系 | 或 者 …、 或 者 … 

东 TEM 连贯 关系 | temporal 的 前 三 个 字母 首先 … 然 后 

8 | TEMi | 连贯 选 枝 | 同一 下 标 表示 同一 关系 。 | 首先 …、 然 后 

9 CON 条 件 关 系 | conditional 的 前 三 个 字母 | 只 要 … 就 … 

10 | CON-i | 条 件 选 枝 | 同一 下 标 表示 同一 关系 “| 只 有 '…\ 不 管 … 

11 | CSQ-i 结果 选 枝 consequence 音节 首 字 母 才 …、 就 … 

12 | CAS 因果 关系 | causal 的 前 几 个 字母 因为 … 所 以 
CAS-i 2 人 cause 的 前 几 个 字母 由 于 …、 既 然 … 
CSQr-i 结果 选 枝 | 同一 下 标 表示 同一 关系 因而 …、 那 么 
SUP 从 二 系 | suppositional 前 三 个 字母 | 如 果 … 那 么 
SUP-i 假设 选 枝 | supposed 的 前 三 个 字母 假使 …、 即 使 … 

7 | CSQ-i | 结果 选 枝 | 同一 下 标 表示 同一 关系 “| 那么 "否则 

| 二 二 系 | adversative 的 中 间 字 母 虽然 … 但 是 
CES-i 让 步 选 枝 | concessive 的 中 间 字 母 虽然 …、 诚 然 … 
VER-i 转折 选 枝 | 同一 下 标 表 示 同 一 关系 然而 …、 不 过 … 

21 | PUR 目的 关系 | purposive 的 前 三 个 字母 | … 

22 | PUR-i 目的 选 枝 | 同一 下 标 表示 同一 关系 
MEN-i 手段 选 枝 | means 的 前 三 个 字母 没有 专用 的 连词 


说 明 :《〈1) 篇 章 语 义 关 系 的 标记 代码 ,一律 采 用 大 写字 母 。(2) 
篇 章 语义 关系 的 标记 代码 , 尽 可 能 采用 语言 学 文献 上 通用 的 缩写 ,以 
便 记 忆 和 人 工 标 注 及 校对 。(3) 并 列 . 递 进 .选择 和 连贯 这 四 种 承接 
性 的 关系 ,其 中 的 选 枝 用 相同 的 标记 ,并 暗示 其 选 枝 可 以 是 两 项 以 上 
的 。(\4) 和 条件、 因果 、 假 使 .转折 和 目的 这 五 种 条 件 性 的 关系 ,其 中 的 
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选 枝 基本 上 是 条 件 与 结果 的 两 项 对 举 , 因 此 用 不 同 的 标记 。(5) 选 
枝 标记 中 的 下 标 i 是 一 个 代数 值 , 代 表 i，j，k… 以 降 的 各 个 字母 。 
相同 的 字母 表示 处 于 同一 种 条 件 一 结果 关系 之 中 。 
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本 文 以 信息 抽取 等 语言 信息 处 理工 程 为 应 用 背景 ,根据 袁 敏 林 
〈2004) 提 出 的 “基于 论 元 结构 的 语义 标注 的 体系 和 规范 ,选择 新 闻 报 道 
中 关于 职务 调动 的 真实 文本 ,分 别 从 论 元 结构 、 远 辑 结构 和 篇 章 结 构 三 个 
方面 ,进行 语义 关系 标注 的 实践 。 这 些 文本 分 为 段落 .单条 简讯 和 全 文 三 
种 类 型 , 藉 此 可 以 发 现 不 同 长 度 单 位 的 文本 在 语义 结构 和 语义 表达 方面 
的 若干 差异 。 


0 引言 


本 文 以 信息 抽取 等 语言 信息 处 理工 程 为 应 用 背景 ,分 别 选择 新 
闻 报 道中 关于 职务 调动 的 真实 文本 进行 语义 标注 的 实践 。 关 于 语义 
标注 的 理论 和 规约 ,我 们 有 专文 讨论 和 说 明 ,在 这 里 也 随 文 作出 说 明 
和 交代 。 这 些 文本 分 为 段落 .单条 简讯 和 全 文 三 种 类 型 ,下 面 依次 列 
出 。 


1 新 闻 段 落 的 语义 标注 


这 些 文本 都 是 新 闻 报 道中 的 比较 完整 的 段落 ,主题 都 是 关于 职 
务 变 动 的 。 来 自 孙 斌 (2000) ,是 他 的 信息 抽取 模型 (InfoX) 的 应 用 实 
例 “ 职 务 变 动 ” 的 测试 语 料 。 这 些 文本 的 编号 原文 没有 ,是 我 们 为 了 
查找 和 核对 的 方便 而 加 上 去 的 。 


Cl) [本 报 ]A{ 伊 斯 兰 堡 }{12 月 31 日 }j7 电 [ 记 者 王 南 ]A 报 
道 : [L 巴 基 斯 坦 穆斯林 联盟 谢里夫 派 候 选 人 、 原 最 高 法 院 大 法 
官 称 罕 默 德 。 拉 非 克 。 塔 拉 尔 ]s,{ 今 天 }r{ 在 巴 国民 议会 、 参 
议院 以 及 各 省 议会 选举 中 }， 当 选 [巴基斯坦 第 九 任 总 统 ]m， 
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[任期 ]raLV]L5 年 ]Re。 [ 塔 拉 尔 jsvA〈 将 ?ae{ 于 明 天 } 宣 普 就 
职 ]Re。 


说 明 : (iD 新 闻 报 道 的 引 语 中 的 “ 电 ? 可 以 看 作 是 个 名 词 ,这 个 
音节 名 词 还 没有 收入 《现代 汉语 词典 》。 其 相应 的 双 音 节 名 词 是 

“电讯 >, 意思 是 : 通过 电话 .电报 或 其 他 无 线 电 设备 传播 的 消息 。 
这 个 双 音 名 词 已 收入 (现代 汉语 词典 》。 为 了 标注 的 简单 和 语义 角 
色 关 系 的 清晰 ,我 们 暂时 忽略 其 中 的 名 词 化 之 后 的 指称 性 意义 
(Cdesignative meaning) ,而 径直 标注 其 名 词 化 之 前 的 谓词 性 结构 的 
陈述 性 意义 关系 (assertive relation) 。 即 假定 “用 无 线 电 传播 的 消 
息 ” 这 种 名 词性 结构 是 从 “用 无 线 电 传播 消息 ?这 种 动词 性 结构 上 ， 
通过 名 词 化 转换 而 派生 出 来 的 。 也 就 是 说 ,姑且 把 这 里 的 “电解 
释 为 是 动词 ,意思 是 : 通过 电话 .电报 或 其 他 无 线 电 设备 传播 消 
息 。 参 见 第 3 部 分 第 (1) 例 的 说 明 中 对 “专电 ?的 解释 。“ 本 报 ” 之 
类 表示 机 构 的 名 词性 成 分 ,在 这 种 场合 具有 拟人 化 的 语 用 特点 , 因 
而 具有 [十 human] 的 语义 特征 ,充当 动词 “ 电 ” 的 施 事 (agent, 简写 
汐 .A2。 

(ii) 新 闻 报 道 的 引 语 中 的 处 所 (location, 简写 为 L) 和 时 间 
(time, 简写 为 T) 论 元 通常 不 用 介词 “在 .于 ?等 来 引导 。 

(iiil“ 报 道 ? 类 动词 通常 带 命 题 性 超级 论 元 ,这 种 论 元 的 论 旨 和 角 
色 是 系 事 (relative, 简写 为 Re) 。 这 种 超级 论 元 中 一 定 包 含 动 词性 
成 分 ,这 种 动词 性 成 分 的 论 元 结构 也 需要 进行 语义 标注 。 可 以 通过 
括号 来 表示 和 辨识 其 和 套 层次 。 根 据 同 样 的 道理 , 当 我 们 把 “ 电 ?处 
理 为 动词 之 后 光电? 所 支配 的 后 续 一 连 串 句子 也 是 它 的 系 事 。 为 了 
简便 ,我 们 在 这 里 作 一 个 总 的 说 明 , 然 后 在 实际 作 语 义 标注 时 省 去 了 
这 一 层次 。 

CGv)“ 当 选 ?类 任职 动词 的 主体 性 论 元 的 论 旨 角色 可 以 归 和 人 经 
事 (experiencer, 简 写 为 Ex), 即 经 历 了 某 种 变化 的 具有 感知 性 的 主 
体 ; 其 客体 性 论 元 的 论 旨 角色 可 以 归 人 系 事 (relative, 简写 为 Re)， 
即 在 事件 结构 中 跟 主 体 性 论 元 相关 的 事物 ,比如 经 事 所 担任 的 某 种 
职务 。 动 词 “ 就 职 ” 一 般 不 单独 使 用 ,通常 跟 * 宣 执 ? 连 用 。“ 宣 誓 就 
职 ” 的 主体 论 元 ,具有 一 定 的 施 动 性 (causation) ,可 以 归 人 施 事 。 但 
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是 ,为 了 跟 其 他 任职 动词 的 论 元 结构 相 协调 ,把 “ 宣 上 誓 就 职 ? 的 主体 论 
元 也 可 以 归 人 经 事 。 当 然 , 为 了 周全 ,可 以 把 这 两 种 论 则 角色 都 标注 
上 去 ;并 且 , 在 这 两 种 标记 之 间 用 斜 拔 号 (/) 隔 开 。 

〈Y) 像 "任期 ?等 既 无 施 动 性 、 又 无 感知 性 的 主体 论 元 ,可 以 归 信 
主事 (theme, 简写 为 Th) 。 

Cvi) 为 了 区 别 ,动词 性 成 分 的 上 必 有 论 元 用 方 括号 标志 , 非 必 有 
论 元 用 花 括 号 标志 。 

Cviil“ 任 期 5 年 ?可 以 看 作 是 “任期 为 5 年 2 的 省 略 形式 ,其 中 ， 
所 省 略 的 动词 标记 为 LV]。 参 看 第 2 个 文本 中 的 最 后 一 句 话 。 这 里 
“5 年 ?是 真 宾语 ,其 论 则 角色 可 以 归 人 系 事 。 

Cviii) 副词 “将 ?表示 将 来 时 (future tense, 简 写 为 fut) 。 

ix) 从 篇 章 结 构 的 角度 看 ,这 一 段 中 有 三 个 句子 ,每 个 句子 都 
有 一 个 时 间 论 元 “12 月 31 日 …… 今 天 …… 明 天 …'…” 正 好 顺序 把 名 
子 组 织 成 一 段 话 语 , 其 中 引 语 中 的 所 指明 确 的 “12 月 31 日 ? 跟 正 文 
中 的 “今天 .明天 ?构成 参照 语 与 指示 语 之 间 的 照应 和 索引 关系 ;再 加 
上 正文 中 的 谓语 核心 动词 "当选 ……. 宣 拆 就 职 ……” 之 间 的 顺序 性 的 
先后 事件 关系 ,正好 显示 出 整个 段落 是 按照 时 间 顺 序 .用 顺 叙 这 种 令 
述 手法 来 写作 的 。 


《2)《 据 [新 华 社 ]A{ 香 港 }jL{1 月 3 日 )jr 电 }w[ 香 港 特区 政 
府 ]A{ 昨 天 } 公布 (了 et[ 香 港 特区 基本 法 推广 督导 委员 会 成 
员 名 单 je,[ 政 务 司 长 陈 方 安生 jx 出 任 [ 委 员 会 主席 jg。,[ 高 苦 
华 ijex 任 [ 副 主 席 ]ge,[ 其 他 成 员 s]m 包 括 [8 位 特区 政府 高 级 官 
员 和 12 位 社会 不 同 界 别人 士 ]gs。 [他们 iitx 的 任期 ]m 均 为 [两 
年 由 es。 


说 明 : 〈i) 介词 “ 据 ? 可 以 带动 词性 成 分 作 宾语 , 比如 :“ 据 报道 、 
据 估计 、 据 小 王 说 ”。 这 种 介词 的 宾语 的 论 骨 角色 可 以 归 人 系 事 , 但 
我 们 认为 介词 是 论 旨 角色 的 标记 ,所 以 不 必 标注 介词 宾语 相对 于 介 
词 的 论 旨 角色 ,而 是 标注 整个 介 宾 结构 相对 于 后 面 的 谓语 核心 动词 
的 论 旨 角色 。 

〈ii) 这 种 介词 结构 可 以 独立 作 报 道 的 引 语 。 其 论 旨 角色 可 以 归 


300 基于 认 知 的 汉语 计算 语言 学 研究 


人 方式 (manner, 简 写 为 M) 。 支 配 这 种 论 元 角色 的 谓词 及 其 必 有 论 
元 是 “本 报 记 者 某 某 某 报道 一 类 结构 (比如 ,第 1 条 文本 中 的 “记者 
王 南 报道 ,可 以 省 略 。 一 旦 省 略 了 这 种 结构 , 便 使 据 …… 电 ?” 一 类 
结构 失去 了 依托 ,其 论 元 角色 也 模糊 了 。 

(Ciii) 助词 “了 ”表示 完成 体 (perfective aspect, 简写 为 perf) 。 

(Civ) 后 句 中 的 代词 “他 们 ”跟前 句 中 的 先行 词 “ 陈 方 安生 ”“ 高 
苇 华 ?和 ?其 他 成 员 ” 之 间 的 照应 关系 ,正好 起 到 把 句子 衔接 成 为 语 篇 
的 连贯 (cohesion) 作 用 。 


(3) { 附 记 }jw: 《目前 }r,[ 徐 虎 ,]A 既 做 [老师 ]w 又 当 [ 学 
生 ]e,[Lei]^ 奔波 于 { 两 个 课堂 )。 [上 海 市 房屋 土地 管理 局 j]A 
(为 广泛 推广 徐 虎 精神 ,提高 居民 住宅 管理 水 平 }Ai ,成 立 (了 )a 
[一 所 “ 徐 虎 学 校 ”]R。 [上 海 市 房管 系统 35 岁 以 下 的 青 工 ]s、 
都 { 在 这 里 j)i 脱产 培训 。[ 徐 虎 ]ex 被 [e]A 任 命 为 [这 所 学 校 ， 
的 校长 jae。 


说 明 : GD“ 附 记 ”类 篇 章 说 明 词 语 的 论 旨 角色 可 以 标记 为 方式 ， 
详 见 第 2 条 文本 中 的 说 明 (ii) 。“ 既 …… 又 ……” 等 小 句 内 部 的 关联 
词语 不 作 标记 。“ 都 ”等 副词 “脱产 ”等 表示 方式 的 状语 都 不 加 标记 。 

(ii 后 续 句 中 承 前 省 略 的 论 元 成 分 是 空 语 类 (empty category)， 
用 [e] 标 记 ; 并 用 下 标 来 表示 它 跟 其 先行 成 分 的 语义 同 指 关 系 。 空 语 
类 通常 是 可 以 明确 地 补 出 来 ,并 且 补 出 来 的 语句 形式 一 般 是 合 语法 
的 ,只 有 少数 句子 因为 特定 句法 结构 的 限制 而 不 合 语法 。 

(Ciii) 介词 是 论 元 角色 的 标志 ,俗称 “ 格 标记 ”(case marker) 。 为 
了 醒目 , 跟 动 词 一 样 ,用 着 重点 标注 。 另 外 约定 : 在 动词 之 前 ,整个 
介词 结构 都 置 于 一 个 括号 中 , 即 作为 一 个 论 元 成 分 ;但 是 在 动词 之 后 
置 于 括号 之 外 , 即 把 动词 和 其 后 的 介词 看 作 一 个 动词 性 成 分 .D 当 
“被 > 等 引导 必 有 论 元 的 介词 之 后 不 出 现 宾 语 时 ,用 空 语 类 [e] 作 标 
记 , 并 加 上 同 指 下 标 和 论 旨 角色 标记 。 这 种 带 空 语 类 作 宾 语 的 介词 ， 


@ 这 样 处 理 有 句法 .语义 和 音 系 学 上 的 考虑 , 详 见 圳 入 林 (2003) 及 其 所 引 的 参考 文 
献 。 
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因为 作为 动词 短语 的 一 部 分 ,所 以 不 用 放 在 方 括号 中 , 即 单独 把 空 语 
类 放 在 括号 中 。 

Siv) 目的 (aim, 简 写 为 Ai) 是 非 必 有 论 元 , 置 于 花 括 号 中 。 因 为 
我 们 约定 : 谓词 性 成 分 的 必 有 论 元 用 方 括号 套 起 来 ,可 有 论 元 用 花 
括号 套 起 来 ,一律 在 括号 后 加 上 论 旨 角 色 标 记 。 

〈《Y) 代词 性 成 分 和 其 先行 成 分 的 语义 同 指 关 系 , 通 过 加 共同 的 
下 标 来 标注 。 

vi 后 句 中 的 指示 词 “ 这 里 ”跟前 句 中 的 先行 参照 词 “ 徐 虎 学 
校 " 之 间 的 照应 关系 ,正好 起 到 衔接 语 篇 .呼应 前 后 的 作用 。 


4) [ 刘 沈 明 iex( 原 ?me{ 在 福建 省 海洋 渔业 公司 ji 当 [ 车 
间 主 任 jne,[Leijsx. 下 岗 (5 年 多 )}ga, [他 ]A 到 处 打工 。 《去 年 十 月 
底 }T,{ 当 他 重新 拿 起 笔 来 准备 应 试 的 时 候 }T,[ 那 种 久违 了 的 
“找到 组 织 " 的 感觉 ]m 重 又 回 到 [身上 je 。 


说 明 : iD“ 重 、 又 ?等 重复 副词 暂时 不 作 语义 分 析 , 因 而 也 不 加 
语义 标记 。 

'ii) 动词 性 成 分 之 后 的 “5 年 多 ”等 时 量 成 分 是 一 种 准 宾语 ,在 
论 旨 角色 上 可 以 归 人 范围 (range, 简写 为 Ra) 。 

Xii)“ 身 上 ?等 处 所 性 成 分 是 “ 回 到 ”等 表示 移动 的 动词 性 成 分 的 
必 有 论 元 ,在 论 则 角色 上 可 以 归 和 人 表示 终点 或 目标 (goal) 的 处 所 (简写 
为 LCG)) 。 像 处 所 这 类 论 旨 角色 ,对 于 有 的 动词 性 成 分 来 说 是 必 有 论 
元 (如 本 例 所 示 ), 对 于 有 的 动词 性 成 分 来 说 却 不 是 必 有 论 元 。 

iv) 从 上 例 可 以 发 现 ,同一 个 动词 可 以 带 一 个 以 上 的 时 间 论 
元 ,这 些 论 元 的 排列 顺序 是 从 较 大 的 时 间 到 较 小 的 时 间 。 

〈v) 时 间 副 词 “ 原 ”表示 过 去 时 (past tense, 简 写 为 past) 。 

(vi) 指示 词 “ 这 、 那 "直接 修饰 .限定 其 先行 语 构成 的 复 指 性 结 
构 时 ,为 了 简单 ,可 以 不 标注 其 照应 关系 。 


《5a){1996 年 初 i7,[ 李 长 水 gx 担任 (了 )》per[ 市 公安 局 长 、 
党 委 书记 je，,[eijs: 负 责 [ 市 公安 局 的 全 面 工 作 ]R。。 全 他 ;je 上 
任 后 )7，LPROi]A 立即 召开 [党 委 会 ]m,[PRO]A 研究 [( 跟 ) 群 
众 息 息 相 关 的 治安 问题]。[ 他 i]A 提出 ,[{ 在 社会 治安 综合 治 
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理 中 记 ,公安 系统 k 的 责任 ]m 最 大 ,Lekjm 要 [Lek]sL 把 工作 重 


生 ) 下 章 人 78 人 证 所 全 


众 ],[ek]^ 走 [ 联 户 联防 ”的 治安 路 子 ]w jg。 je。 


说 明 : (iD PRO 代表 隐 含 在 语 境 中 的 必 有 性 论 元 成 分 , 由 于 名 
法 结构 上 的 限制 ,一 般 是 不 可 补 出 来 的 。 比 如 ,上 例 中 "召开 党 委 会 ” 
的 应 该 是 “ 李 常 水 ”和 "党 委 一 班 人 ”。 

(ii) 圆 括号 中 的 介词 “ 跟 ” 原 文 没 有 ,是 我 们 根据 文 意 补 上 去 的 。 

(iii) 助动词 “要 ”等 的 主体 性 论 元 (主语 ?在 论 旨 角色 上 可 以 归 
和 主事 ,客体 性 论 元 (宾语 ) 在 论 冒 角色 上 可 以 归 人 系 事 。 另 一 种 办 
法 是 把 助动词 看 作 是 一 种 模 态 算 子 ,可 以 作 如 下 这 种 标记 : 


(5b){1996 年 初 }7 计 L 李 长 水 ex 担任 (了 )pet[ 市 公安 局 长 、 
党 委 书记 jge,[ei]ex 负 责 [市 公安 局 的 全 面 工 作 jRe。 全 他 ,je 上 
任 后 jr,[PROi]A 立即 召开 [党 委 会 ]R,[PRO;]A 研究 [(\ 跟 ) 群 
众 龟 息 相关 的 治安 间 题 外 。[ 他 站] 提出 ,[{ 在 社会 治安 综合 治 
理 中 并 ,[ 公 安 系 统 k 的 责任 ]m 最 大 ,Lek]A( 要 oa 人 [把 工作 重 


[ 联 户 联防 ?的 治安 路 子 ]w ) Re。 


说 明 : 〈i) 更 为 简单 和 可 靠 的 办 法 是 : 把 助动词 看 作 是 一 种 附 
加 在 其 所 支配 的 动词 的 论 元 结构 之 上 的 模 态 算 子 , 表 示 某 种 情态 
Cmodality, 简 写 为 mod) ,并 用 花 括号 标志 其 辖 域 。 这 样 , 不 仅 标明 
“了 其 所 支配 的 动词 的 论 元 结构 关系 ,而 且 还 标明 了 句子 在 情态 上 表 - 
示 的 是 一 种 非 现 实 的 断言 Cirrealis assertion) 。 下 面 原则 上 都 按 这 
种 方式 标注 。 

(ii) 后 两 句 中 的 人 称 词 “ 他 ”跟前 句 中 的 先行 词 “ 李 长 水 ”之 间 的 
照应 关系 ,正好 起 到 连贯 语 篇 .呼应 前 后 的 作用 。 


(6) {1984 年 jz,[L 广 昌 ]^ 成 立 《 了 》)wr[ 全 国 第 一 个 白莲 科 
研 所 外,[ 刘 光亮 je 担任 [所 长 jge,[ejse 倍 感 [ 户 上 担子 的 沉 
重 j]Re。 


说 明 : (iD 从 上 例 可 以 看 出 , 空 语 类 的 论 则 角色 可 以 跟 其 先行 语 
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不 一 样 。 

“iD)“ 倍 感 " 等 心理 感觉 类 动词 的 主体 论 元 是 感 事 (sentient, 简 
写 为 Se) ,表示 感觉 内 容 的 宾语 在 论 旨 角色 上 可 以 归 和 人 系 事 。 

5iii) 从 篇 章 结构 的 角度 看 ,前 后 小 句 中 的 谓语 核心 动词 “成 
立 …… 担 任 ……” 之 间 的 顺序 性 的 先后 事件 关系 ,正好 显示 出 整个 名 
子 是 按照 时 间 顺 序 ` 用 顺 人 氢 这 种 叙述 手法 来 写作 的 。 


(7) 11954 年 }r，[24 岁 的 梁 惠 珍 ;je 开始 (了 》pef[ 行 医生 
沽 jne。 [她 jjA{ 先 )}rswi 是 { 在 一 个 县 卫生 所 )} 工作 ,Eeex{ 后 
来 }T&rgwri 成 为 [海南 省 屯 昌 县 人 民 医 院 的 妇 产 科 主 任 ]e。 [长 
期 的 临床 实践 jcu 使 [她 jase 看 到 [许多 不 育 妇女 的 痛苦 js,[ 梁 
惠珍 ;js 决心 [Lei]a{ 用 更 好 的 方法 )i 解决 [这 个 问题 ]]e。 


说 明 : GD“ 使 等 使 令 动词 的 主体 论 元 可 以 归 入 致 事 (causer， 
简写 为 .Cau) ,其 客体 论 元 可 以 归 人 受 事 。 同 时 ,使 令 动词 一 定 要 有 
后 续 动 词 ,并 且 其 受 事 正 好 是 后 续 动 词 的 主体 性 论 元 ,这 就 是 传统 语 
法 所 谓 的 “ 兼 语 ”。 我 们 通过 合 取 符 号 && 来 在 一 个 论 元 上 同时 标记 
其 相对 于 前 后 动词 性 成 分 的 两 种 论 则 和 角色。 这 从 语法 理论 上 讲 , 会 
违反 生成 语法 的 GB 理论 中 的 论 旨 原则 : 一 个 论 元 只 能 担任 一 种 论 
旨 角 色 ,一 种 论 旨 角色 只 能 赋予 一 个 论 元 。.@ 但 是 ,从 语言 信息 处 理 
工程 的 角度 上 讲 , 这 种 合成 标记 法 比较 经 济 , 也 便于 识别 和 处 理 , 具 
有 更 高 的 效率 。 这 种 具有 客体 和 主体 双重 论 旨 角色 特征 的 成 分 也 可 
以 简单 地 归 人 经 事 , 即 某 种 事件 的 经 历 者 。 

Xii) 介词 "用 ?通常 引进 工具 论 元 (instrument, 简 写 为 D 。 

(iii) 为 了 显示 语 篇 结构 关系 ,我 们 把 副词 “ 先 ” 等 能 把 小 名 、 句 
子 、 甚 至 段落 等 较 大 的 语言 单位 连接 起 来 、 使 之 成 为 句子 话语、 甚至 
篇 章 的 词语 或 其 他 表层 结构 上 的 词汇 特征 ,笼统 地 叫做 话语 衔接 词 
语 (cohesive expression ,简写 为 COH) 。 这 里 的 “先后 来 ”表示 时 间 
性 的 连贯 关系 (temporal relation, 简写 为 TEM) ,我 们 用 相同 的 下 标 
来 表示 一 组 关联 词语 处 于 相同 的 衔接 关系 之 中 。 


@ ”关于 论 旨 原则 , 详 见 徐 烈 灿 (1988) 第 271 页 。 
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(Civ) 后 句 中 的 两 个 代词 “她 ”跟前 句 中 的 先行 词 “ 梁 惠珍 "之 间 
的 照应 关系 ,正好 起 到 语 篇 衔接 作用 。 最 后 一 个 小 名 的 主体 论 元 不 
用 代词 “她 ”\ 而 是 直接 用 指称 词语 “ 梁 惠 珍 ”, 可 能 是 为 了 避免 行文 措 
辞 的 重复 单调 。 即 用 了 修辞 上 “ 避 复 ”的 修辞 手法 。 


(8) {1989 年 }jr[[ 梁 惠珍 je 退休 后 jr,L[Leij 与 丈夫 ij]A 同 
到 [老家 湛江 je ,Le 开办 了 ur[C “惠珍 联合 医院 kt”]R,[ek] 
专 治 [ 男 女 不 育 症 ]。 


说 明 :〈iD“ 开 办 ”的 施 事 是 空 语 类 ,其 先行 语 显然 是 “Lei] 与 丈 
夫 ”。 而 这 个 先行 语 中 的 空 语 类 si 的 先行 语 是 其 先行 句 中 的 “ 梁 惠 
珍 ”。 

(ii) 上 面 (7)(8) 两 个 文本 应 该 是 一 个 段落 ,前 后 句子 中 的 衔接 
词语 “ 先 ” 和 时 间 论 元 “后 来 …… 粱 惠珍 退休 后 …… ”把 句子 组 织 成 一 
段 话 语 , 并 显示 出 整个 段落 是 按照 时 间 顺 序 . 用 顺 叙 这 种 人 氢 述 手法 来 
写作 的 。 


(9) [“ 黎 明 俱乐部 mw 共有 [18 名 成 员 ]we。{ 在 成 立 大 会 
上 和 ,和 白 滨 一 良 i]ex 被 Ley]A 选 为 [代表 je,[ 木 庭 健 太 邹 ;gx 被 
[e*]^ 选 为 [干事 长 jw。。 [他 们 iHi]jgx 都 《 曾 ?mse 担 任 [ 原 公明 党 副 
书记 长 jge。 


说 明 : 〈i) 我 们 用 加 号 来 连接 复数 性 代词 后 面 的 几 个 同 指 下 标 。 
(ii) 当 “ 被 ”等 表示 被 动 的 介词 之 后 不 出 现 宾语 (通常 是 施 事 ) 
时 ,把 “被 VP” 看 作 是 一 个 动词 性 成 分 。 参 看 第 (11) 条 ,说 明 (i)。 当 
然 也 可 以 把 这 个 省 去 的 主体 性 论 元 用 空 语 类 的 形式 补充 出 来 , 当 其 
先行 词 不 明确 时 ,可 以 用 问号 作 下 标 。 
5iii 后 名 中 的 代词 “他 们 ?跟前 句 中 的 先行 词 “ 白 滨 一 良 ” 和 ”“ 木 
庭 键 太 郎 ? 之 间 的 照应 关系 ,正好 起 到 衔接 语 篇 .连贯 语义 的 作用 。 
(10) [捷克 总 统 哈 维尔 ]A{ 二 日 jr{ 在 布拉格 宫 江 任命 
(了 ywu[ 捷 克 新 政府 成 员 ]sv。[([ 由 托 绍 夫 斯 基 ]e, 出 任 [总 
理 ]e 的 ) 新 政府 mm 共有 [十 和 八 名 成 员 ]je，,{ 其 中 )[L 新 入 国 的 人 
数 ]m 占 [一 半 ]&。[ 示 局 政府 中 区- 有 [七 名 无 党 派 人 士 ]u， 
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[这 ]m 是 [历届 政府 中 少 有 的 现象 ]g. 。[ 以 克 劳 斯 为 首 的 捷克 原 
政府 jz, 是 { 一 九 九 七 年 十 一 月 三 十 日 } 被 迫 荐 职 的 。[ 托 绍 夫 
斯 基 ]A{ 二 日 }jr{ 在 新 政府 成 立 后 会 见 记者 时 } 表示 ,[[ 本 届 政 
府 ; 优先 考虑 的 问题 ]m 是, [Le 了]A 积极 争取 加 入 [北约 和 欧 
盟 ]ree ,[ei ]A[ 同 经 济 犯 罪行 为 ]w 作 斗 争 ， [下 加 1 快 [经 济 改 
革 ]p jge]ne。 


说 明 : (i 当 “ 任 命 等 动词 的 客体 论 元 是 指 人 名 词 时 ,其 论 旨 角 
色 可 以 归 人 经 事 ; 当 “任命 等 动词 的 客体 论 元 是 职务 名 词 时 ,其 论 旨 
角色 可 以 归 和 人 系 事 。 上 例 中 的 “捷克 新 政府 成 员 ”似乎 既 涉 及 人 员 ， 
又 涉及 职务 ;为 了 周全 ,特意 把 这 两 种 论 旨 角色 都 标记 上 去 ,并 用 斜 
撤 号 表示 这 两 种 角色 之 间 是 一 种 析 取 关系 。 

(ii 我 们 把 “争取 加 入 ”“ 作 斗争 ”等 动词 性 结构 当 作 一 个 谓词 
整体 ,不 加 分 析 。 

GiiD“ 是 …… 的 ”等 强调 性 成 分 “被 迫 ” 等 方式 副词 暂 不 标记 。 

Civ) 从 篇 章 结构 的 角度 看 ,这 一 段 整体 上 是 用 顺 叙 的 手法 来 组 
织 句子 的 ,时 间 论 元 和 动词 “……: 于 和 部 任命 .………: 贞 和 5 5 一 大 
九 七 年 十 一 月 三 十 日 .…… 辞职 …… 消光 洒 至 消 襄 4 成 立 ……- 人 | 
的 顺序 性 的 先后 事件 关系 ,正好 显示 了 这 一 点 。 但 是 ,中 间 用 插 叙 的 
手法 交代 了 原 政府 辞职 这 一 事件 (用 方 括号 标示 )。 这 种 插 叙 是 通过 
时 间 论 元 的 转变 来 显示 的 ,具体 地 说 是 把 时 间 论 元 “12 月 31 日 " 插 
在 两 个 同 指 的 时 间 论 元 “二 日 "之 间 , 来 显示 要 插入 一 段 叙 述 。 可 见 ， 
高 层次 的 写作 叙述 手段 ,也 会 在 低层 次 的 论 元 结构 中 落下 些许 蛛 丝 
马 迹 。 

(11)[ 塔 拉 泵 i]es{ 于 1997 年 ;3 月 jy 当选 [ 巴 参议 院 议 
员 ]&,[ei]ss{ 同 年 12 月 15 日 jr[ 被 执政 党 穆斯林 联盟 谢 派 ] 
提名 为 [总 总 统 候选 人 ] 。 


说 明 : (iD 当 " 被 ”等 表示 被 动 的 介词 之 后 出 现 宾语 (通常 是 施 
事 ) 时 ,把 “被 NP? 看 作 是 一 个 论 元 成 分 。 参 看 第 (9) 条 ,说 明 (iD 。 

5GiiD“ 同 年 等 指示 性 词语 (deixis) ,标明 其 参照 性 的 先行 词语 。 
“同年 ?的 语义 跟 其 参照 性 词语 的 所 指 相同 。 
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Ciii) 后 一 小 句 中 的 指示 词 “ 同 年 > 跟前 一 小 句 中 的 参照 性 的 先 
行 词 “1997 年 > 之 间 的 照应 关系 ,正好 起 到 把 两 个 小 句 衔接 成 一 个 大 
名 的 作用 。 


(12) [ 思 佐 ]A 宣布 ,[[ 南 非 总 统 受 德 拉 ]A( 已 ms 任命 [ 南 
非 驻 中 国 研 究 中 心 主任 戴 克 瑞 ]e 为 [ 首 任 驻 华 大 使 我 


说 明 :〈i) 为 了 一 致 和 醒目 ,动词 之 后 跟 动词 不 连续 的 介词 也 放 
在 表示 论 元 成 分 的 方 括号 之 外 ; 即 把 “任命 …… 为 ”看 作 是 一 个 动词 
性 结构 ,属于 一 种 不 连续 的 动词 性 成 分 。 参 看 第 (3) 条 ,说 明 (ii 。 


(13) { 据 [新 华 社 ]A{ 伊 斯 兰 堡 ;}j-t1 月 1 日 jj)r 电 ]}w([ 记 
者 杨 士 龙 ]\[V])[ 新 当选 的 巴基斯坦 总 统 拉 菲 克 。 塔 拉 尔 kr 
{ 今 天 ijr{ 在 这 里 ;} 宣 考 就 职 。 [他 km 是 [ 巴 建国 以 来 的 第 九 
任 总 统 ]Re。 


说 明 : 《iD 在 新 闻 引 语 中 ,记者 姓名 之 后 ,经 常 省 略 “ 报 道 ”一 类 
动词 性 成 分 。 参 看 第 1、20 个 文本 。 

(Gil“ 今 天 、 这 里 ”等 多 个 指示 词语 ,分 别 用 不 同 的 下 标 来 标明 其 
跟 各 自 的 参照 性 词语 的 照应 关系 。 

6Giii 后 一 句 中 的 人 称 词 “ 他 ”跟前 一 句 中 的 先行 词 “ 拉 菲 克 “" 塔 
拉 尔 ”之 间 的 照应 关系 ,正好 起 到 连 呐 语 篇 :呼应 前 后 的 作用 。 


G14) [越南 国防 部 ]A{ 三 日 }r 举行 (了 yud[ 对 一 拢 高级 将 
领 的 授 街 、 授 职 仪式 术 。{ 根 据 越南 国家 主席 和 政府 总 理 的 决 
定 }v,[ 国 防 部 长 范文 茶 jx[ 由 中 和 驳 evyies) 提升 为 [上 将 jseruee 。 
[ 陶 仲 历 少将 js: 任 [ 国 防 部 副 部 长 .越南 人 民 军 总 参谋 长 je, 范 
清 银 中 将 ] 任 [人 民 军 总 政治 局 主任 ]ge,[ 阮 华 盛 少 将 ]e。 任 [ 人 
民 军 总 技术 局 主任 ]m 江 阮 文学 大 校 jzx 任 [人 民 军 总 总 后 勒 局 主 
任 ]。。 


说 明 : GD“ 举行? 等 制作 性 动词 的 客体 论 元 的 论 则 角色 可 以 归 
人 结果 (result, 简 写 为 及 ) 。 

(ii) 为 了 简单 ,可 以 把 由 “根据 2 引导 的 表示 依据 .前 提 的 论 元 的 
论 旨 角色 归 和 方式 (manner, 简 写 为 MD) 。 
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《iii) 在 “由 中 级 提升 为 上 将 ”中 ,中 将 ”的 论 旨 角色 可 以 归 人 表 
示 来 源 (source) 的 处 所 (简写 为 L(S)) “上 将 ”的 论 旨 角色 可 以 归 入 
表示 目标 .终点 的 处 所 L(CG)。 这 里 为 了 跟 其 他 相关 的 职务 变更 动 
词 的 客体 论 元 相 协调 一 致 ,同时 也 分 别 把 它们 标记 为 Rel 和 Re2。 

iv) 从 篇 章 结构 的 角度 看 ,这 一 段 第 一 个 句子 (话题 句 ) 用 的 是 
机 构 名 词 作 主体 性 论 元 ,后 面 的 句子 (包括 小 句 ) 都 用 从 属于 这 一 机 
构 的 个 体 名 词 作 主体 论 元 ,这 种 不 同 的 主体 性 论 元 在 语义 上 的 所 属 
关系 ;再 加 上 话题 句 中 具有 概括 性 的 动词 短语 “举行 …… 授 衔 、 授 职 
仪式 " 跟 后 续 句 中 比较 具体 的 动词 “提升 、 任 ”之 间 在 语义 上 的 上 下 位 
关系 ,正好 显示 出 整个 段落 是 按照 “ 先 总 后 分 ?这 种 篇 章 组 织 方法 来 
展开 叙述 的 。 


(15) [阿尔 巴 尼 亚 前 人 民 议 会 主席 团 主席 列 希 ]ex{ 一 日 
晚 )r{ 在 地 拉 那 ) 病逝 ,[ 终 年 ]m[LV][ 入 十 五 岁 ]Rs。 [ 列 希 ]m 
是 [阿尔 巴 尼 亚 反 法 西 斯 民族 解放 战争 中 的 杰出 人 物 ]ge。[ 列 
项 上 px《 曾 ?ms 连续 担任 (过 )pesreer[ 十 一 局 议员 jey[ei]es{ 并 )}App 
{ 在 一 九 五 三 年 至 一 九 八 二 年 期 间 } 担任 [阿尔 巴 尼 亚 人 民 议 
会 主席 团 主 席 国家 元 首 之 职 ]Re。。 


说 明 : (iD“ 终 年 ?在 表示 “人 去 世 时 的 年 龄 ”时 ,只 能 作 主 语 ,并 
且 只 能 以 “ 数 词 十 岁 ” 作 谓语 。 为 了 方便 和 系统 ,可 以 假定 中 间 隐 含 
了 “是 ,为 ”一 类 谓词 ,标记 为 LV]。 这 样 ,从 论 旨 角 色 上 看 ,这 里 的 
“终年 ?是 主事 “人 和 八 十 五 岁 ” 是 范围 。 

(ii) 助词 * 过 ?表示 经 历 过 某 种 事件 ,可 以 归 大 过 去 完成 体 (past 
perfect, 简写 为 past-perf) 。 当 “并 ”起 联结 小 向 的 作用 时 ,是 语 篇 关 
联 词语 ,表示 递 进 关系 (additive relation ,简写 为 ADD) 。 

5iii) 从 篇 章 结构 的 角度 看 ,让 告 类 文体 通常 要 用 到 倒叙 的 写作 
手法 , 即 先 交 代 某 大 的 死亡 时 间 、 地 点 等 事项 ;然后 交代 该 人 的 生平 
事迹 。 这 种 倒叙 往往 要 用 “ 曾 ” 等 表示 过 去 的 时 体 算 子 来 显 性 地 标 
志 。 本 例 在 倒叙 其 任职 经 历时 ,还 用 了 语 篇 关联 词语 “并 ” 作 标 记 。 


《16)[ 黎 德 俊 i]ex 是 [北京 中 诚信 租赁 有 限 公 司 的 董事 
长 地 ,[ei]s( 曾 ?se{( 在 中 汽 专用 汽车 珠海 制造 有 限 公司 ) 任 
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(S) D 


《过 spet[ 总 经 理 ]Re。 [他 ;]{ 先 )TEwi { 从 目 本 )}Les) 进 [原装 
马自达 323i 至 [香港 ]-e 四 认 :汪汪 就 地 拆散 [e]， { 按 配件 }w 
报关 进口 。 (然后 }rewi,{ 再 }rgwi[ 由 广东 、 广 西 、 湖 北 . 四 川 等 地 
的 汽车 修配 厂 ]A[ 将 它们 ?]e 组 装 成 [车 jR。{ 为 掩 人 耳目 }co， 
{ 给 走私 非 法 组 装 车 }me 找 [一 个 合法 的 《4 产 本 中 工 他 ]A 
(又 })rewi{ 以 每 辆 车 4000 元 的 代价 }w，,{ 从 海南 汽车 工业 公司 北 
海 公司 }us 购买 (了 uaLHMC5010 的 铭牌 、 标 牌 、 合 格 证 等 一 整 
套 手 续 ]。 就 是 ( 任 着 这 移 似 合法 的 伪装 和 一 些 不 为 人 知 的 手 
段 }jw,[ 缆 德 俊 的 这 批 “海马 ”]A 偷 逃 (了 ysed[ 关 税 、 增 值 税 、 消 费 
税 ], 畅 行 无 阻 地 开 进 (了 ea[ 京 城 ].o 。 


说 明 : (iD“ 从 日 本 ?在 论 旨 角色 上 可 以 归 和 人 表示 来 源 的 处 所 工 


(iD“ 为 掩 人 耳目 ”的 论 旨 角 色 可 以 归 人 目的 (aim, 简 写 为 Ai) 。 
(iii) 对 于 事件 结构 中 的 非 主动 的 相关 参与 者 ,如 果 是 有 生性 


的 ,那么 其 论 旨 角色 可 以 归 人 与 事 (dative, 简 写 为 D) ;如果 是 非 有 生 
性 的 事物 或 事件 ,那么 其 论 旨 角 色 可 以 归 和 人 系 事 。 这 里 的 “给 走私 非 
法 组 装 车 ,其 论 旨 角 色 可 以 归 人 系 事 。 


Giv) 这 里 的 代词 “它们 ”的 先行 语 没有 以 显 性 的 词汇 形式 出 现 ， 


而 是 隐 含 在 上 下 文 语 境 中 。 其 所 指 是 : 被 拆散 成 为 零 部 件 的 那 批 原 
装 马自达 323 汽车 。 


(v)“ 克 德 俊 的 这 批 “ 海 马 ” 通 过 拟人 化 的 语 用 手段 ,充当 施 事 


角色 。 在 “ 开 进 了 京城 ”中 ,终点 性 处 所 “京城 ?是 “ 开 进 ”的 必 有 论 元 。 


(vil“ 就 是 ”等 强调 性 成 分 “畅行 无 阻 等 方式 状语 都 不 加 请 义 


关系 方面 的 标记 。 


Cvii) 语 篇 衔接 词语 “……- 先 ……- 然后 ,再 ……- 洒 . 区 6 ”等 


显示 整个 段落 是 按照 顺 叙 的 手法 来 组 织 篇 章 结构 的 。 


(17) {([ 陈 云 峰 j]A 读 [ 电 大 ]swvw) 期 间 )r,[ 他 器 s 认 识 
(了 sx{ 现 在 的 妻子 黄 赛 红 ji}ra。 [这 位 与 他 ; 有 相同 经 历 的 农村 
青年 j]A， { 从 代课 教书 }ies 《到 做 临时 工 }je，{ 处 处 ) 体现 
(了 )ut[([ 她 i]A〈 不 ?us{( 安 于 [生活 现状 ]ge} 的 ) 个 性 和 坚强 的 恤 
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力 ]。{1994 年 }j7 针 黄 赛 红 ij]wvae 考 取 ( 了 )pet[ 浙 江 省 政法 管 
理 干 部 学 院 ]wnwre,[eijsx{ 通 过 三 年 的 自费 脱产 学 习 }wy { 于 
1996 年 7 月 jy 毕业 。{ 也 )jcoa 就 { 在 这 个 月 jzr,[ 陈 云 峰 iss{ 因 
出 色 的 工作 成 绩 }aa{ 从 城关 镇 内 设 机 构 青 马 办 事 处 }ics 调 到 
[ 沙 善 办 事 处 ]uee [ejaex 当 [ 副 主 任 ]e。 


说 明 : GD“ 认识 ”等 心理 感觉 类 动词 的 主体 论 元 是 感 事 Se, 表 
示 感 觉 对 象 的 宾语 在 论 旨 角色 上 可 以 归 和 人 对象 (target, 简 写 为 Ta) 。 

5ii) 为 了 使 指示 性 词语 跟 其 参照 性 词语 在 语义 上 一 致 ,所 以 有 
时 下 标 不 一 定 标记 在 指示 词 之 后 ,而 是 标记 在 整个 指示 性 短语 之 后 。 
多 用 这 里 的 指示 性 短语 “这 位 与 他 有 相同 经 历 的 农村 青年 ? 跟 先 行 

语 “ 现 在 的 妻子 黄 赛 红 ” 同 指 ， 省 下 全 但 证 主人 有 ” 跟 先 行 语 “1996 
年 7 月 ” 同 指 。 

(iii) 对 于 动词 读 ? 来 说 “电大 ” 既 像 是 系 事 ,又 像 是 方式 ;对 于 
动词 “考取 ?来 说 ,其 主体 性 论 元 既 像 是 施 事 , 又 像 是 经 事 或 感 事 ; 其 
客体 性 论 元 既 像 受 事 , 又 像 是 受 事 ,又 像 是 系 事 或 对 象 。 为 了 周全 ， 
我 们 把 它们 以 析 取 的 形式 都 标注 上 去 。 

iv) 当 副 词 “ 也 ”用 以 联结 小 句 、 句 子 和 段落 时 ,是 语 篇 关联 词 
语 ,表示 并 列 关系 (coordinate relation ,简写 为 COR ) 。 


(18) { 当 ([ 玉 环 县 级 行政 机 关 ; ]A{ 向 社会 }uee) 公开 招考 [ 国 
家 公务 员 ]ie) 时 },[ 陈 云 峰 ,]e{ 以 人 [笔试 ]w{ 全 县 第 二 、 [ 面 
试 ]m{ 全 县 六 第 一 的 ) 成 绩 }w 被 [e]、 录用 ， [esi]m 二 位 从 
事 劳动 仲裁 工作 的 国家 公务 员 ] 。 [ 黄 赛 红 ， 下 { 也 }cog{ 以 优异 
的 成 绩 Jv[ 被 县 司法 局 录用,[et]e[[ 被 ea]]A 下 派 到 [ 陈 由 
基层 司 法 所 je [es]x 成 (了 ?ua[ 一 名 司法 员 ]Re。 


说 明 : 〈i 双重 方 括号 中 [[ 被 e]] 表 示 承 上 文 而 省 略 的 介词 结 
构 ,为 了 语义 理解 的 方便 ,在 这 里 补充 出 来 ,再 加 上 语义 同 指 和 从 
角色 标记 。 

(ii 当 副词 < 也 ”充当 语 篇 关联 词语 时 , 既 可 以 用 在 句 首 , 如 例 
〈17) 所 示 ; 也 可 以 用 在 后 续 句 的 主语 之 后 ,如 本 例 所 示 。 

'iiil 上 面 (17)(18) 两 个 文本 应 该 是 一 个 段落 或 篇 章 中 的 ,它们 
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通过 主体 性 论 元 在 两 个 人 物 之 间 来 回 变换 ,来 交叉 叙述 ;在 表层 结构 
上 上 ,都 用 了 关联 副词 “也 ”来 衔接 叙述 不 同 的 主体 的 句子 。 在 叙述 时 ， 
又 通过 两 个 时 间 论 元 “1994 年 …… ,1996 年 ?在 时 间 上 的 先后 关系 ， 
来 显示 篇 章 组织 上 采用 了 顺 氢 的 方式 。 也 就 是 说 ,这 种 篇 章 结构 有 
比较 明显 的 表层 标志 。 


主任 的 ) 省 委 常委 、 常 务 副 省 长 汪洋 ]A 提高 (了 )roi[ 竣 门 了 
LV]: [es]A《 要 aa 人 ft 以 市 场 的 眼光 }w 办 [体育 ]P ,Le 了] 抓 [ 选 
才 ] [Le 了 ]A 抓 [教练 ]》， [领导 让 (要 mad 化 与 运动 员 、 教 练 
员 ] 滚 在 [一 块 ]iee 汪 日 全 :本 艰苦 奋斗 ， [se 了 进 军 7 
运 ]Lee) [er 再 创 [ 辉 煌 j} 
说 明 : GD“ 气 可 鼓 而 不 可 泄 ? 和 ”再 创 辉 煌 ?等 熟 语 , 也 可 以 作为 
一 个 谓词 性 成 分 而 不 加 论 元 角色 方面 的 语义 分 析 。 
(Gi“ 的 ” 字 结 构 中 ,谓词 性 结构 中 的 空 语 类 一 般 跟 “ 的 ? 字 结 构 
所 修饰 的 中 心 语 同 指 .9 
6iii) 为 了 简单 ,助动词 要 ?等 辖 域 中 承 上 省 去 的 主体 性 论 元 都 
可 以 不 作 补充 标记 ,当然 也 可 以 像 上 面 那样 加 上 空 语 类 标记 。 
(Giv) 标记 LV] 人 代表“ 说 ”一 类 被 省 略 的 言语 动词 。 
(20) [本 报 ]A{ 阿 比 让 ){1 月 5 日 }7 电 上 记者 杨 责 兰 ]^ 报 
道 , [([e]e{ 在 背 尼 亚 大 选中 }: 赢得 [连任 ] 的 ) 表 尼 亚 总 统 
会 ]A{ 昨 天 江 正式 宣布 Lesijse jwmy{{ 在 去 年 了 2: 明 ; 29 诅 束 s80 日 
举行 的 大 选中 }) 5,[ 肖 尼 亚 非 洲 民 族 联盟 候选 人 \ 现 任 总 统 丹 尼 
尔 。 阿 拉 普 。 莫 伊 jjA{ 以 较 大 优势 }v 击败 (了 ?wa[L14 名 反对 党 
候选 人 ]p,[e]e 再 次 当选 为 [肯尼亚 总 统 ]jwe,[ 任 期 ]mw[V][5 
年 jge)i。 


说 明 : iD“ 连任 ?是 名 动词 ,可 以 作 形 式 动词 “赢得 ”的 宾语 ;其 


中” 详 见 朱德 四 (1978) 和 (1983) 。 
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论 旨 角色 可 以 归 人 结果 ,而 不 是 受 事 。 从 意义 上 看 ,连任 这 种 情况 是 
人 为 地 创造 出 来 的 。 从 句法 形式 上 看 ,这 种 宾语 不 能 作 介词 “把 ”的 
宾语 ,这 跟 一 般 的 结果 论 元 和 受 事 论 元 都 不 同 。 

'ii) 隐藏 在 方式 论 元 中 的 动词 宣布 ?的 系 事 论 元 省 去 了 , 它 跟 
后 面 的 一 连 串 小 句 在 语义 上 有 同 指 关系 。 

iii“ 就职 就任? 等 担任 动词 的 后 续 句 往往 要 交代 获 任 的 经 过 
等 情况 , 即 整个 话语 采用 倒叙 的 手法 ;其 表层 标志 是 使 用 相关 的 几 个 
时 间 词 语 ,比如 本 例 中 的 “1 月 5 日 …… 昨天 …… 去 年 2 月 ,29 日 至 
强 碍 隔 取 ”等 逆向 性 时 间 词 系列 。 


《21)[ 罗 多 尔 佛 。 塞 尔 特 扎 。 塞 维 里 诺 jsx{ 五 日 jr{ 在 雅 
加 达 六 正式 就 任 [ 东 南亚 国家 联盟 ( 东 盟 ) 新 一 二 任 秘 曲 状 李 1 
[ 塞 维 里 诺 ;jss{ 于 去 年 ， 七 月 j5f{ 在 吉隆 玻 召 开 的 第 三 十 届 东 盟 
外 长 会 议 上 并 被 [se]A 任命 为 [东盟 秘书 长 ]w。 [他 ; 的 任 
期 ]m (将 ?ae{ 于 二 OO 二 年 ) 结束 。 [ 塞 维 里 诺 j]m 且 [ 菲 律 宾 
的 一 位 共 交 家 ]。 ,Eee 〈( 曾 ) 地 ,先后 担任 [菲律宾 驻 美国 、 中 国 
和 马来西亚 等 国 的 外 交 使 节 ]。{ 一 尤 匹 二 至 二 尤 克 扰 年 
闻 }7,[ 塞 维 里 诺 ;jex 任 [ 菲 外 交 部 副 部 长 ]ge,[ei] 记 负责 [与 东盟 
有 关 的 事务 等 权 。。 


说 明 :〈i) 这 里 第 2 句 中 的 时 间 指 示 词 “去 年 ”的 参照 词 要 到 更 
前 面 的 上 文 (包括 新 闻 引 语 ) 中 去 找 。 这 个 参照 时 间 一 般 是 新 闻 发 出 
的 时 间 。 我 们 用 问号 表示 在 本 段 中 其 先行 语 不 明确 。 
4i“ 就 职 . 就 任 ? 等 担任 动词 的 后 续 句 往往 要 交代 获 任 的 经 过 
等 情况 , 即 整个 话语 采用 倒叙 的 手法 ;其 表层 标志 是 使 用 相关 的 几 个 
时 间 词 语 , 比如 本 例 中 的 “五 日 …… 去 年 七 月 .res ”等 道 向 性 时 间 词 
系列 。 有 时 还 要 倒叙 主体 性 论 元 的 过 去 的 任职 经 历 , 其 表层 标志 是 
使 用 过 去 时 标记 ”* 曾 (经 )”, 然 后 是 一 组 相关 的 顺序 性 的 时 间 词 语 , 比 
如 本 例 中 的 “…… 入 一 亏 九 二 军 一 丸 九 二 年 间 …… 人 
6C22) 有 尼日尔 警方 ]A{ 日 前 ?过 破获 [一 个 ([ei]a 企图 暗杀 
[和 返 纳 萨 拉 总 统 吉 的) 阴谋 团伙 站 rs。 工 尼 日 泵 通讯 社 ]A{ 三 日 和 
报道 说 ,[[ 被 捕 的 三 名 团伙 成 员 ]A 供认 ,[[ 他 们 i]A《 原 )u 定 
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[{ 于 去 年 ， 十 二 月 二 十 九 日 jy 行动 ]Jwe,[ 暗 杀 对 象 ]mu{ 除 总 统 
以 外 )} ,还 包括 [ 几 名 政府 重要 成 员 ]w。]w。 ] Re。 { 据 报道 }v,[ 该 
上 暗杀 团伙 ; 的 主谋 ]mw 是 [ 哈 马 。 阿 马 杜 j] Re 。 [他 i ] 广 现任 [ 尼 ( 晶 
尔 ) 反 对 派 “ 社 会 发 展 全 国运 动 ? 总 书记 je ES 有 过 去 ， } 
〈 曾 ?ms 担任 (过 ypeseed[ 政 府 总 理 ]ge。[ 警 方 ]A{ 一 日 jr〈( 已 ?ms 速 
捕 ( 了 )ud[ 哈 马 ， 阿 马 杜 ],{ 但 )}veg[L 他 i]A( 不 me s{ 承 认 [Lej]m 
[下 这 起 暗杀 活动 ms 有 关 e 六 [esJ]A 称 [[ 自 型 ]e[ 被 人 ]A 证 本 
陷 ]w。 


说 明 : 〈(i) 这 里 的 时 间 指 示 词 “日 前 .去 年 .过 去 ”的 参照 词 要 到 
更 前 面 的 上 文 ( 包 括 新 闻 引 语 ) 中 去 找 。 这 个 参照 时 间 一 般 是 新 闻 发 
出 的 时 间 。 其 中 ,日 前 ”是 一 个 模糊 性 的 时 间 指 示 词 , 泛 指 其 参照 时 
间 的 前 几 天 。“ 过 去 ”也 是 一 个 模糊 性 的 时 间 指 示 词 , 泛 指 其 参照 时 
间 ”“ 现 任 …… ”以 前 的 时 间 。 我 们 用 问号 作 下 标 , 表 示 该 指示 语 的 先 
行 参照 语 在 本 段 中 不 明确 。 

Ci 为 了 语义 标注 的 精细 ,的 ” 字 结 构 用 圆 括号 标示 * 其 中 的 谓 
词性 成 分 ,也 标记 其 论 元 角色 等 语义 关系 ,其 中 跟 中心 语 同 指 的 空 语 
类 (主体 论 元 或 客体 论 元 ) 也 用 下 标 标 示 。 

(ii2“ 除 总 统 以 外 ?的 论 旨 角色 很 难 确定 ,这 里 姑且 归 估 系 事 ， 
因为 总 统 也 包括 在 暗杀 的 对 象 之 中 。 

(iv) 为 了 简单 ,把 “企图 暗杀 、 报 道 说 ”等 动词 组 合 看 作 是 一 
动词 性 成 分 。 

Cv) 这 把 和 本 区 全 放 和 全 由 
动 , 归 人 系 事 论 元 。 

Cvi) 副词 < 不 "是 知 定 算 子 (negative operator, 简写 为 neg) ,我 
们 用 花 括 号 标志 其 辖 域 。 

(vii) 这 一 段落 的 篇 章 结构 比较 复杂 ,基本 的 叙述 方式 是 顺 氢 
| 日 前 破获 ……- 佐 认 2 证 和 搬 ) ,但 是 其 
中 ( 方 插 号 […… ] 所 示 ) 又 有 揪 叙 (……… 主谋 是 …… ) ,在 插 叙 中 因为 
涉及 担任 事件 所 以 又 引出 倒叙 (…… 现任 …… 过 去 曾 担任 过 ……) 。 
这 种 复杂 的 叙述 安排 ,在 表层 结构 上 都 有 时 间 论 元 或 时 体 算 子 作 形 
式 标志 ;并 且 , 最 后 一 句 的 主体 论 元 转换 时 ,用 了 语 篇 关联 词语 “但 ” 
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来 表示 转折 关系 (adversative relation ,简写 为 VER) 。 


(23) [ 邢 云 f]ss，{1952 年 } 生 ,[ei] 了 LV][ 大 学 文化 ]。。 
[egj 历任 [内 蒙古 伊 克 昭 盟 副 盟 长 、 盟 委 副 书记 、 盟 长 ]。， 
Leijex{1996 年 10 月 起 }7 任 [ 盟 委 书记 、 盟 人 大 工 委 主任 ]ge。 


说 明 : (i) 这 里 的 LV] 代 表 “ 有 、 具 有 ”一 类 隐 含 动词 (implied 
Vertb ) 。 

(iii) 从 篇 章 结 构 的 角度 看 ,生平 介绍 类 文本 通常 用 顺 叙 的 写作 
手法 , 顺 次 交代 主体 论 元 的 出 生 学习、 工作 .任职 经 历 等 事项 ;这 种 
顺 氢 往往 要 用 一 组 相关 的 顺序 性 的 时 间 论 元 来 显 性 地 标志 , 比如 本 
例 中 的 “1952 年 ee 1986 年 10 月 起 的 并 


(24) 工 尚志 派出 所 ; mm 地 处 [哈尔滨 繁华 地 带 ],[ 全 市 最 大 
的 百货 商店 、 最 大 的 酒店 和 最 大 的 菜市 场 ]in 都 在 [他 们 | 管辖 区 
内 下 。{{1995 年 zf(CL 杨 光 i ]& 上 任 ) 后 不 入)r,[ 许 多 人 中 便 
主动 找 上 [ 门 小 来 ,[ 有 的 唱 ]A 拉 [ 他 ijP&A 合 伙 做 [生意 下 ,有 
的 吕 ]A( 想 ?aaa {[ 找 [他 i]psaA 做 [靠山 ]p]ke})i。[ 对 此 中 p[ 杨 光 iA 
一 概 拒 绝 。 [十 几 年 的 从 警 生涯 ]e ,使 [他 ; pg&se， 悟 出 [道理 外 : 
[ 身 ]m 居 [ 阅 市 ] ,[ei ]。( 要 ui{ 远 离 [ 灯 红酒 绿 ]w。 } 3;[eij]ax 作为 
[一 所 之 长 ]w ,[ei]A 更 (要 )。oa{[{ 为 全 所 民警 ) 做 出 [表率 ]) 。 


说 明 :〈i) 这 里 复数 性 的 人 称 代词 “他 们 ”的 先行 词 是 机 构 名 词 
短语 “尚志 派出 所 ”。 

ii 部 分 代词 有 的 ” 指 人 或 事物 中 的 一 部 分 ,其 先行 词 是 上 文 
的 “许多 人 ”。 两 个 有 的 ”的 所 指 可 以 一 样 ,也 可 以 不 一 样 ;因此 ,在 
下 标 上 加 数字 以 示 区 别 。 

(ii)“ 做 生意 、 做 靠山 、 身 居 闸 市 、 做 出 表率 ”等 熟 语 ,也 可 以 作 
为 一 个 谓词 性 成 分 而 不 加 论 元 角色 方面 的 语义 分 析 。 

Civ) 指示 词 “此 ”的 先行 参照 词语 是 “1995 年 …… 许 多 人 .…… 做 
靠山 "一 个 大 句 , 为 了 避免 符号 标注 过 于 复杂 ,这 里 不 用 下 划 线 , 而 是 
用 花 括号 标志 其 界 域 。 

(v) 这 里 的 “ 想 ” 表 示 愿 望 ,也 是 助动词 。 

(vi 担任 动词 上任” 是 不 及 物 动词 ,只 能 支配 经 事 论 元 ,表示 
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职务 的 系 事 论 元 只 能 是 一 种 语义 上 的 隐 含 性 成 分 ,于 是 职务 及 相关 
的 机 构 组 织 等 必要 信息 项 目 都 要 从 上 下 文中 寻找 。 在 本 例 中 , 首 名 
的 主体 性 论 元 “尚志 派出 所 ”表明 了 机 构 , 末 句 的 系 事 论 元 “一 所 之 
长 ”表明 了 职务 。 


《25) [该 委员 会 jmh 是 [全 国法 律 硕士 专业 学 位 教育 的 专业 

性 组 织 jge,[ 其 ; 主要 任务 ]m 是 : [Le 指导 、 协调 [全 国 法 律 专 

业 学 位 教育 活动 jpjge。[ 委 员 会 主任 jge[ 由 司法 部 部 长 肖扬 jz 

担任 ,[ 委 员 ]w 是 { 在 有 关 单位 和 专家 推荐 的 基础 上 }u,[ 由 国务 

院 学 位 委员 会 、 国 家 教委 和 司法 部 ]A 选 聘 。 

说 明 : 〈i) 指示 性 短语 “该 委员 会 ”的 参照 性 先行 词语 要 到 上 文 
去 找 ;, 指 示 词 “其 ”的 参照 词 是 包含 指示 词 的 短语 “该 委员 会 ”。 

《ii 指示 词 “ 该 委员 会 .其 ”的 参照 语 都 是 ……… 委员 会 的 这 使 得 
它 在 话语 中 获得 很 高 的 话题 性 (high:topicality)， 成 为 整个 段落 展开 
叙述 的 线索 。 这 是 一 种 利用 同一 话题 组 织 话语 篇 章 的 令 述 手法 。 


(26) [新 华 社 ]A{ 北 京 ){1 月 6 日 江 电 [中 华人 民 共 和 国 
主席 江泽民 ]^{ 根 据 全 国人 民 代 表 大 会 常务 委员 会 的 决定 }v， 
任命 [ 王 学 贤 ]e, 为 [中 华人 民 共 和 国 驻 南非 共和 国 特命 全 权 大 
使 ]R。。 
(27) [新 华 社 ]A{ 达 累 斯 萨 拉 姆 ){1 月 6 日 }jr 电 [ 坦 桑 尼 
亚 总 统 姆 卡 帕 ]A{5 日 jr{([e]A{ 在 内 罗 毕 六 宁 贞 [[ 英 入 卫 加 
任 [ 青 天 亚 总 统 包 Je) 时 并 说 ,[[ 寄 忆 下 此 次 大 逃 的 成 功 ]m 表 
明 [[ 肯 尼 亚 和 非洲 国家 ]ii( 不 )( 需 要 [[ 别 人 了 教 [他 们 卫 [ 史 
何 实 行 民主 ]pjge},[ 非 洲 人 ij]se 完 全 知道 [[ 投 谁 的 票 ]m 符合 [ 自 
己 j 的 利益 je jge jg]ee。 
说 明 : iD 照应 性 代词 “自己 ?在 本 例 中 有 先行 语 , 需 要 标注 其 同 
指 关 系 。 但 是 ,疑问 代词 “ 谁 ? 在 这 里 是 一 种 任 指 用 法 ,没有 先行 语 ， 
所 以 不 需要 标注 其 同 指 关 系 。 


《28) {1938 年 2 月)7*[ 中 共 晋 费 移 省 委 ]A{ 在 太 拓 区 兴 
县 ) 设立 [办 事 处 ]R，[ 由 省 委 统战 部 部 长 安子 文 ]zx 兼 任 [ 办 事 
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处 主任 ]R。{1938 年 7 月 j7，,{ 在 兴 县 办 事 处 的 基础 上 jw 成 立 
(了 )wu[ 中 共 太 后 特 委 ],[ 安 子 文 同 志 jex 任 [书记 ]。 ,[ 坟 兰 区 
的 党 组 儿 只 mm 进 入 ( 了 )eed[L 大 发 展 阶段 ]e 。{(1939 年 4 月 )， 
[中 共 太 阁 特 委 ]m 改 称 [ 中 共 太 岳 地 委 ]se,[ 安 子 文 同 志 ], 任 
[书记 jke。{1939 年 11 月 }r， 成 立 4( 了 )wa[( 以 [ 薄 一 波 同志 ]z， 
任 [书记 jge 的 ) 晋 东南 军政 委员 会 ]R。{1940 年 j1 月 )z,[ 中 共 北 
方 局 ]、 决定 [[ 太 天 地 区 ; ]m 成 为 [独立 的 战略 区 ]。 [ea 成 立 
[ 太 岳 区 党 委 ] ,[ 安 子 文 同 站 1] 性 [用 基 ] { 同 年 i1 月 19 

日 j7,[ 陈 广 同 志 ]A 奉 [ 和 八路军 总 部 命令 ] 率领 [八路 军 三 八 六 
共和 二 本 认证 [ 晋 东 南 军政 委员 会 会 ]m 改 称 为 [大 若 军 
哎 夫 员 会 志 ,[ 苹 工 波 同 志 ]e. 任 [书记 ]w,[ 主 要 成 员 ]m 有 [ 陈 
广 、 安 子 文 等 同志 ]e。 


说 明 : D“ 成 立 太 岳 区 党 委 ” 前 省 去 的 施 事 似乎 是 前 面 句子 中 
的 “ 太 岳 地 区 ”。“ 以 薄 一 波 任 书记 ”似乎 不 太 通 顺 ,更 合适 的 表达 是 
“以 薄 一 波 为 书记 ”。 

ii 用 相关 的 顺序 性 的 时 间 词 语 作 一 组 相关 句子 的 时 间 论 元 ， 
是 顺 叙 手法 展开 叙述 、 组 织 篇 章 的 典型 手段 。 比 如 本 例 中 的 “1938 
年 2 月 …… 1938 年 7 月 …… 1939 年 4 月 ……- 1939 年 11 月 .……: 
1940 年 1 月 ………: 同年 1 月 19 日 .…… 机 


〈29) [ 何 长 工 js.{1952 年 8 月 调 入 [地 质 部 ]。 
前 ;)r [eijsx( 曾 ?pss 任 [重工 业 部 副 部 长 、 代 部 长 ] wy{ 
铁 、. 造 船 \, 电 机 和 动力 工业 为 重点 })uy[e]A 抓 ( 了 )eed[ 重 工业 部 
的 组 建 工 作 ]j,[ei]A 商定 人 了 ed[L 我 国 重 工业 和 航空 工业 发 展 
的 基础 ]。 


说 明 :〈i) 指示 词 “ 此 前 ”的 参照 词语 是 “1952 年 8 月 ”, 所 指 为 : 
1952 年 -8 月 以 前 的 一 段 时 间 。 这 说 明 指 示 词 的 所 指 跟 参 照 词 语 的 
所 指 有 关 ，, 但 不 一 定 相 同 。 

Xiil“ 就 职 . 就 任 . 调 任 ` 调 人 ”等 担任 动词 的 后 续 句 往往 要 交代 
获 任 的 经 过 等 情况 , 即 整个 话语 采用 倒叙 的 手法 ;其 表层 标志 是 使 用 
相关 的 几 个 时 间 词 语 , 有 时 还 要 倒叙 主体 性 论 元 过 去 的 任职 经 历 ,其 
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表层 标志 是 使 用 过 去 时 标记 “ 曾 ( 经 )” 等 时 体 算 子 , 然 后 是 一 组 相关 
的 顺序 的 时 间 词 语 。 


(30)[ 艾 哈 迈 德 。 本 。 称 罕 软 德 。 萨 利 姆 ]A 提交 的 (? 了 ) 
[理事 会 年 度 报告 二 ,[ 与 会 代表 ,]A[ 对 萨 利 姆 在 执行 秘书 处 
1997 年 工作 计划 中 所 做 的 努力 和 取得 的 成 绩 jge 表 示 [ 感 谢 jae， 
[Lei ]A{ 并 }App 一 致 选举 [ 萨 利 姆 jx 继续 担任 [下 一 一 局 理事 会 秘书 
长 ]Re。 

说 明 :〈i 这 里 “提交 的 ?中 的 “的 ? 疑 为 "了 "之 误 。 

(ii) 这 里 的 空 语 类 [ei] 如 果 用 其 先行 语 “ 与 会 代表 ” 代 进 去 以 
后 ,句子 就 不 通 了 ;但 是 ,从 语义 的 论 元 结构 和 句法 的 深层 结构 的 角 
度 看 ,这 里 的 确 有 一 个 空缺 的 成 分 ,其 论 旨 角 色 是 施 事 。 这 就 是 篇 章 
中 的 句子 的 结构 特点 : 通过 省 略 来 衔接 句子 。 

Giii) 这 里 把 “继续 担任 ? 当 作 一 个 动词 性 成 分 而 不 加 语义 关系 
分 析 ,也 可 以 把 “继续 ”处理 为 状语 , 跟 * 一 致 ”一 样 不 作 语义 关系 分 
析 。 

(iv) 语 篇 关联 词语 “并 ”把 最 后 两 个 小 句 衔接 起 来 了 。 


(31a) [新华 社 ]A{ 斯 德 哥 尔 摩 )u{1 月 7 日 ijr 电 ( 记 者 许 福 
瑞 LVJ])LCLe]A( 曾 )m si{ 为 调解 巴勒斯坦 和 以 色 列 冲突 }Ai 作 出 
《过 useped[ 努 力 ] 的 ) 挪威 政府 ]， { 最 近 i} 任命 [ 罗 德 一 拉 
森 5j]ex 为 [ 驻 中 东 巡 回 大 使 [er]A 重新 负 起 [([eu] 调解 [ 巴 
以 冲突 ] 的 ) 使 命 |。 


说 明 : 〈i) 隐藏 在 主体 论 元 的 修饰 语 中 的 过 去 时 标记 ” 曾 ”, 使 得 
整个 句子 在 叙述 方式 具有 一 种 隐 性 的 顺 叙 色彩 。 如 果 改 成 显 性 的 顺 
叙 表 达 ,那么 将 可 能 是 下 面 的 (31b) 。 

(31b)[ 挪 感 政 府 ]A{ 过 去 ij}T&Tewi( 曾 ost{ 为 调解 巴勒斯坦 

和 以 色 列 冲突 }co 作 出 (过 ?pasreet[ 努 力 ]R,[Le]A{ 最 近 i)T&Tewti 任 

命 [ 罗 德 一 拉 森 \]m 为 [ 驻 中 东 巡 回 大 使 ]ge,Lek]A 重新 负 起 

[ELa ln 调解 [ 巴 以 冲突 ] 的 ) 使 命 je 。 


说 明 : 〈i) 顺序 的 时 间 论 元 和 过 去 时 标志 “过 去 曾 …… 最 
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近 …'…”，, 使 得 整个 句子 在 叙述 方式 具有 一 种 显 性 的 顺 叙 色彩 。 


(32) [今年 51 岁 . 有 34 年 军 叭 的 齐 文 明 i]A{ 也 jco { 为 
此 ， ) Rn 赢得 (了 ?ped[ 很 多 荣誉 ]Rg ,[ei]A 荣 立 [二 等 功 、 三 等 功 ]， 
[这 项 成 果 ] 被 [e,]^ 评 为 [ 国 家 科技 进步 三 等 奖 ]se。 [他 ;] 被 
[e* 民 评 为 [空军 科技 先进 个 人 ] ,[ei]e{ 并 }Apo 被 [ey]A 评 为 
[ 军 内 有 突出 贡献 的 专家 ]。,[ei] 忆 成 为 [北方 心 脑 血管 病 血 流 
变 学 会 副 主任 委员 ]ne。。 


说 明 : iD“ 被 ”引导 的 施 事 论 元 省 略 了 ,并 且 在 本 段 中 没有 出 现 
其 先行 语 ,所 以 用 问号 标注 。 必 须 说 明 的 是 ,这 些 空 语 类 都 用 问号 作 
下 标 , 但 并 不 表示 它们 是 同 指 的 ;也 就 是 说 ,它们 完全 可 以 跟 不 同 的 
先行 语 发 生 语义 同 指 关系 。 

(ii) 第 二 句 中 的 代词 “他 ? 跟 第 一 句 中 的 先行 词 “ 齐 文明 ”之 间 的 
照应 关系 ,正好 起 到 语 篇 连贯 作用 。 


633)? [南非 真相 委员 会 副 主席 伯 瑞 恩 iA{ 同 日 jr 呼吁， 
L[ 他 ;js 希望 {[[ 博 塔 i]A〈 能 ?ooa{{ 在 最 后 一 刻 ) 改变 [态度 下 ， 
[es]s 同 意 [[s] 到 [真相 委员 会 二 作证 jw。 ) Re 和 和 { 果 真如 
此 kj}sup,[ 真 相 委 员 会 ]\( 将 )u 建议 [[ 卡 思 ]^ 撤诉 je。 [ 博 
塔 je ( 曾 ?m . 任 [ 旧 南非 的 国防 部 长 、 总 理 和 总 统 ] ,[ 他 | 掌握 
的 重要 情况 ]ms{ 对 真相 委员 会 完成 其 使 命 色 至 关 重 要 。[ 真 相 
we 3 次 传唤 [[ 他 | 站 到 场 听证 ]w。 ,{ 得 } 未 [他 ， 网 
均 { 以 有 病 等 理由 )m 拒 绝 [出 席 ]p,[s]A{ 并 }Abn 指 责 [[ 真 相 委 

员 会 的 工作 ]m 是 [马戏 困 表 演 ? 和 “政治 迫害 中 ] 怀 于。。 


说 明 : (iD 为 了 简单 , 像 * 果 真如 此 、 但 .并 ”等 承接 性 语 篇 关联 词 
语 ,直接 在 其 后 标注 。 其 中 “果真 如 此 ”表示 假设 关系 (suppositional 
relation, 简写 为 SUP)。 碰 到 “因为 .…… 所 以 …… \、 如 果 …… 那 
人 “只 要 …… 就 …… ”等 配套 的 表示 条 件 的 关联 词语 , 则 在 其 所 
关联 的 小 名 或 句子 之 后 标注 语义 关系 ,关联 词语 下 面 加 着 重点 。 其 
中 ,指示 词 “ 此 ?参照 词语 即 是 动词 “希望 > 的 系 事 “ 博 塔 …… 作 证 气 
为 了 清晰 ,不 用 下 划 线 ,而 是 用 花 括号 标记 范围 ; 

(ii) 这 一 段落 通过 主体 性 论 元 在 两 个 人 物 及 其 所 属 的 组 织 之 间 


318 基于 认 知 的 汉语 计算 语言 学 研究 


来 回 变换 ,来 交叉 叙述 。 在 叙述 时 ,又 通过 过 去 时 标志 “ 曾 ”, 来 显示 
篇 章 组 织 上 的 插 氢 , 即 补充 交 代为 什么 需要 博 塔 出 来 作证 。 同 时 ,用 
了 “果真 如 此 、 但 .并 ”等 承接 性 语 篇 关联 词语 来 衔接 句子 。 


(34) [摩洛哥 新 一 届 两 院 制 议会 ]A{(7 日 ij} 选 出 [第 一 任 
参议 院 议长 ]se,[ 原 摩洛哥 一 院 制 议会 议长 艾 赛 义 德 ]pex 当 选 为 
[第 一 任 议 长 ]gs。[ 代 表 院 议长 Re 已 ?use{ 于 6 日 江 选 举 产 生 ， 
[ 原 议会 第 一 副 议 长 拉 迪 ]e， 当选 Lei ]Re。 { 至 此 ; ),[ 摩 洛 哥 议会 
从 一 院 制 向 两 院 制 的 转变 ]m 宣 告 [完成 ]ge。[ 现 年 60 岁 的 艾 赛 
义 德 ]px 是 [ 摩 ( 洛 哥 ) 右 要 党 派 完 政 联盟 的 议员 jR。 [exjeLV] 
[法 学 博士 ]w ,Lek]( 曾 ma s: 招 任 (过 ?mm sepet [国务 秘书 和 阿拉 伯 议 
会 联盟 委员 会 主席 等 职 ]Re。 


说 明 : (iD 在 时 间 论 元 “至 此 ”中 ;指示 词 “ 此 ”有 两 个 候选 的 参照 
词语 “7 日 "和 “6 日 ;但 是 ,根据 文 意 来 推算 ,应 该 选择 比较 靠 后 的 时 
间 ， 即 “7 着 。 

(Ci 本 例 通过 -7 日 …… 63 同 - 冯 se ”等 道 向 性 时 间 词 系列 ,显示 整 

个 话语 采用 了 倒 氢 的 手法 。 同 时 ,担任 动词 句 往往 还 要 交代 主体 论 
二 吉 丰 所 要 从 的 交代 李 入 | 有 时 还 要 倒叙 主体 性 论 元 过 去 的 任职 经 
历 , 其 表层 标志 是 使 用 过 去 时 标记 ” 曾 ( 经 )”。 


(35) 并 墨西哥 总 统 塞 迪 略 外 (7 日 江 任命 [ 女 参 议员 罗 萨 
蛙 奥 ,， 格林 jz, 为 [外 交 部 长 je。 [格林 ]A{ 同 日 )}r{ 在 就 职 后 六 
宣布 ,[[ 墨 西 哥 外 交 部 ]A( 将 iu { 本 着 尊重 主权 ,不 干涉 别 国内 
政 的 外 交 政 策 }ws 发 展 [与 各 国 的 关系 jg 。[ 烙 林 ]A{ 在 谈 到 
与 亚太 国家 关系 时 }r 指出 ,[[L 亚 太 国家 Jm 有 具有 [巨大 的 投资 、 
贸易 与 合作 潜力 JR。 , [村西 哥 ]A《 将 yu 加 强 [与 该 地 区 的 合 
作 ]。 Rs [格林 i Jrm{1941 年 } 生 于 [墨西哥 城 ]。 [ 她; 位 是 
[ 枝 西 哥 历 史上 第 一 位 女 外 交 部 长 ]we。 


说 明 : (iD 本 例 通过 “7 日 任命 …… 同日 盖 就 职 ……?” 这 种 时 间 
指示 词 跟 先 行 语 之 间 的 参照 关系 、 任 命 事件 跟 担任 事件 之 间 的 先后 
事件 关系 ,来 组 织 话语 篇 章 。 同 时 ,担任 动词 句 往往 还 要 交代 主体 论 
元 的 生平 ,其 表层 标志 是 使 用 时 间 词 语 作 时 间 论 元 或 者 使 用 时 体 算 
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子 作 标 记 , 本 例 用 的 是 显 性 的 时 间 词 语 *“1941 年 。 


《36) [ 冈 崎 嘉平 太 ， 这 位 ;([ei]( 曾 ?es 任 [日 本 全 日 室 航 空 
公司 总 裁 jge 的 ) 老 人 ]A，{ 生 前 }) 一 百 多 次 来 [中 国 ]ice { 为 恢复 
中 日 邦交 }Ai 奔 波 。 { 与 周恩来 交往 没 多 久 j)jT,[ 这 位 中 国 总 
理 ]m 就 成 (了 bed[ 他 | 心中 所 崇 数 的 孔子 般 的 “圣人 2” 。{ 从 
此 i)7[ 他 i]A[ 将 这 位 “圣人 ” 的 相片 ] 度 获 地 珍藏 在 { 胸 前 巾 
身 处 }Leo (元 十 年 江 一 如 既往 { 直 至 离开 人 世 j5 依然 不 合 。 
{ 当 (人 [他 i 的 儿子 中 &{ 向 摄制 组 )b 讲 起 [老人 去 世 的 4 情景 ]w) 
昧 条,Eeds 坏 分 平静 (， [es LV]) : [< 父亲 门 追随 [他 ; 棠 效 的 
人 人] 到 [天 国 二 去 人 示 pad [Leijs 是 幸福 的 9 


说 明 : iD 为 了 简单 ,把 复 指 性 成 分 处 理 成 一 个 论 元 。“ 一 百 多 
次 、 虔 敬 地 ”等 状语 性 修饰 成 分 ,不 作 语义 标注 。 

(ii) 为 了 语义 显 史 ,把 说 明 叙 述 文本 中 经 常 省 略 的 “说 ”一 类 言 
语 动词 ,用 LVJ 的 形式 标记 出 来 。 

'iii) 像 “ 父 亲 ? 等 有 价 名 词 ,是 一 种 变量 性 成 分 ,其 语义 所 指 要 
依赖 其 从 属 论 元 作为 参照 成 分 来 确定 。 即 要 让 人 知道 这 “父亲 ” 指 的 
是 谁 的 父亲 。 我 们 约定 : 当 这 种 变量 性 成 分 的 上 下 文 有 同 指 的 成 分 
出 现时 ,以 相同 的 下 标 来 直接 标记 其 所 指 ; 当 这 种 变量 性 成 分 的 上 下 
文 没 有 同 指 的 成 分 出 现时 ,以 相同 的 下 标 加 百 分 导 昕 来 间接 标记 它 
跟 其 参照 成 分 的 语义 从 属 关系 。 

(iv) 为 了 简单 ,语气 词 “ 了 ?也 标记 为 表示 完成 体 的 虚词 。 

《y) 后 续 句 中 的 代词 “他 ” 跟 第 一 句 中 作 主 体 性 论 元 的 先行 词 
“ 冈 琦 嘉平 太 ? 之 间 的 照应 关系 ,正好 起 到 语 篇 连贯 作用 。 并 且 , 正 是 
这 种 凝聚 力 很 强 的 照应 和 衔接 关系 ,使 得 这 个 先行 语 成 为 整个 段落 
的 话题 。 

CS 月 二 [ 童 志 成 ]m 来 不 及 [[ei]A 回 给 [ 陈 隆 年 ]p[ 一 句 俏 

皮 话 ja，,[ 公 司 其 他 领导 梁 德 妍 \ 王 润 培 ` 叶 五 池 . 李 广 革 

等 jjs 听 说 [[ 他 DA 出 差 回来 (了 )pet]key [ea 了 ]A{ 志 )》cog 都 不 约 而 

同 地 来 见 见 [([ 上 级 ]A《( 刚 ) s 任命 [ei ] gx 当 目 二 把 手 jRe 的 ) 童 

志 成 jn。 
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说 明 : (iD 为 了 简单 ,这 里 把 时 间 副 词 “ 刚 ” 也 标记 为 表示 过 去 
时 的 虚词 。 

(ii) 这 一 段落 通过 主体 性 论 元 在 一 个 人 跟 一 组 人 之 间 变 换 , 来 
交叉 叙述 。 

(iii) 上 面 把 “来 不 及 ” 当 作 一 个 主要 动词 来 分 析 , 如 果 把 它 看 作 
是 助动词 ,那么 可 以 作 如 下 分 析 : 


《37) b.【[ 童 志 成 丫 &《 来 不 及 ?moa{ 回 给 [ 陈 隆 年 ]o[ 一 句 俏皮 
话 ] 六 [公司 其 他 领导 梁 德 妍 、 王 润 培 . 叶 石 池 、 李 广 壮 等 )]s 听 
说 [[ 他 让 出 差 回来 (了 ?yeed]ge,[si]A{ 也 }cog 都 不 约 而 同 地 来 见 
见 [([ 上 级 ]A〈 刚 ws 任命 Lei]psex 当 [一 把 手 ]we 的 ) 童 志 成 ]r。 


说 明 : 〈(i) 相 比 之 下 ,把 “来 不 及 ”处 理 为 助动词 的 分 析 更 简单 ， 
并 且 正 确 地 反映 出 整个 句子 所 表示 的 时 间 的 非 现 实 性 。 


(38) (1995 年 6 月 ) ,[ 杨 丽华 ijsx[ 被 中 国 国际 航空 公司 ]^ 

任命 为 [ 飞 行 总 队 副 总 队长 je。 [她 ]A{ 从 一 个 普通 的 空中 小 

姐 }rs ,{ 在 空中 工作 22 年 后 } 走 上 《了 ?ea[ 领 导 岗 位 juo， 

[em 不 容易 啊 ! 

说 明 : 〈i) 这 里 “不 容易 ”的 省 略 的 主语 既 可 以 是 “ 杨 丽 华 ”, 也 可 
以 是 整个 句子 “她 …… 走 上 了 领导 岗位 >。 关于 这 种 代词 和 空 语 类 在 
所 指 上 的 波动 现象 ,请 看 喜 航 林 (2002c) 。 

(il“ 就 职 . 就 任 . 调 任 . 调 入 ` 选 举 、 任 命 等 担任 动词 和 任命 动 
词 的 后 续 句 往往 要 交代 获 任 的 经 过 或 生平 事迹 等 情况 , 即 整个 话语 
采用 倒 氢 的 手法 。 在 本 例 中 ,第 二 句 中 作 主 体 性 论 元 的 代词 “她 ? 跟 
第 一 句 中 作 主 体 性 论 元 的 先行 词 “ 杨 丽 华 ” 之 间 的 照应 关系 ,正好 起 
到 语 篇 关联 作用 。 


(39) [新 华 社 ]A{ 大 连 ): 代 月 10 日 j7 电 [ 大 连 市 第 十 二 届 
人 民 代 表 大 会 第 一 次 会 议 ]A{1T 月 10 日 jr 选举 [于 学 祥 ]ex 为 
[市 人 大 常委 会 主任 ]ge,[ei]A 选举 [ 薄 申 来 jex 为 [大 连 市 市 
长 ]Re。 

(40) [墨西哥 恰 帕 斯 州 议会 ]A{7 日 }r 批准 [[ 胡 里 奥 。 重 
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依 斯 ]ex 古 去 [ 州 长 职务 jgejke,{ 并 }Aapp[ei]A 任命 [ 众 议 员 罗 伯 
特 。 阿尔 沃 雷 斯 。 纪 廉 js 为 [新 州长 jge。 { 自 C{ 去 年 12 月 :22 
日 }7{ 在 恰 帕 斯 州 切 纳 洛 市 ) 发 生 [(L45 名 印第安 人 ] 被 
[e; 民 杀 ) 惨 案 j。) 后 }r,[([ 该 州 ; 和 全 国 各 地 ]、 要 要 求 [[ 重 依 
斯 ]s, 引 答 坪 职 ]w。 的 ) 呼 声 ]m 念 来 念 高 。 [得 依 斯 的 娃 职 ， J]m 受 
到 [各 方面 欢迎 ]we。 [一 些 人 士 js 认 为 ,[[ 这 样 做 上 ]m《( 可 以 )a 
针对 公正 解决 屠杀 惨案 ,推动 政府 与 该 州 游击 队 组 织 萨 帕 塔 民 
族 解 放 军 恢复 和 谈 jg，, 产 生 [积极 影响 ]R)]Re。 


说 明 : D“ 发 生 ” 等 表示 存 现 、 消 失 的 动词 之 后 的 论 元 ,其 论 旨 
角色 暂时 归 和 人 系 事 , 以 便 跟 动 词 前 可 以 出 现 主 体 性 论 元 的 句子 相 协 
调 。 例 如 :他们 发 生 了 一 点 儿 误 会 ~ 误会 最 终 发 生 了 ”。 

(ii) 为 了 语义 所 指 上 的 一 致 ,在 整个 包含 指示 词 的 短语 “这 样 
做 ?之 后 加 同 指 下 标 。 

iiD“ 就 职 ` 调 任 ` 选 举 ` 任 命 , 免 去 ”等 担任 动词 和 任免 动词 的 
后 续 句 往往 要 交代 获 任 的 经 过 或 生平 事迹 等 情况 、 或 者 是 被 免 的 原 
因 或 被 免 者 的 生平 事迹 等 情况 , 即 整个 话语 采用 倒 氢 的 手法 。 


41) 《深化 改革 的 大 潮 中 }7,[ 知 识 分 子 韩 兵 ]^ 才 然 辞去 
[公职 ]s 回 到 [ 生 他 ; 养 他 ; 的 都 阳 湖 畔 ]-e 干 起 (了 ?pr[ 农 业 立 
体 开 发 ]。 { 经 过 几 年 奋斗 }ju,[ 他 让 A 带领 [ 乡 亲 们 ijp{ 通 过 股 
份 合作 制 }wy [eti]A 办 起 [ 集 农 \ 科 、 贸 一 体 的 农业 集 团 公 司 下 ， 
[esi 和 实现 (了 eat[ 农 业 产业 化 ]R。 (艰苦 的 创业 中 Tv,[ 韩 
兵 j]A{ 在 乡 亲 的 支持 下 }w 克服 [种 种 困难 jp,[ei]A{ 并 }anpp 赢 得 
本. edt[ 女 主人 公 的 爱情 ]。 《该 剧 ,}rop {[ 情 节 Jjm 曲 折 ,[ 感 情 
纠 葛 jc 让 [人 jsse 回肠 荡 气 }cov 。 


说 明 : (i) 指示 性 短语 “该 剧 ” 的 参照 性 词语 要 到 更 前 面 的 上 下 
文中 去 找 。 

Xii) 从 论 旨 角色 关系 上 看 ,话题 性 成 分 “该 剧 ” 跟 其 说 明 部 分 中 
的 谓词 性 成 分 “曲折 ”和 “让 ……: 回肠 划 气 ?都 没有 关系 。 碰 到 这 种 情 
况 ,索性 标记 话题 (topic, 简写 为 TOP) 和 说 明 (comment, 简写 为 
COMD 这 种 语 用 和 话语 结构 关系 。 
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(CiiD“ 该 剧 ” 是 一 价 名 词 “ 情 节 ” 的 从 属 成 分 ,为 了 简单 ,就 不 标 
记 这 种 降级 述 谓 关 系 了 。 


(42) [诸葛 彩 华 i]ex[ 从 县 委 副 书记 岗位 ]iesyva 调任 [ 代 县 
长 ]ieeovge。[ 上 和 蔡 ]^ 似乎 故意 地 考验 [好 !]。 [ 海 岛 ]jrm 缺 
[水 jg ，,{ 人 偏偏 }veg{(1995 下 半年 }z{ 玉 环岛 上 )[ 滴 水 ]m (未 ooe 
(下 },[ 早 灾 ]m 严 重 ,[ 生 活用 水 ]m 频 频 告 急 。 
说 明 : (iD 对 于 动词 “调任 来 说 ,原来 的 职务 和 后 来 的 职务 都 是 
系 事 ;同时 ,从 路 径 隐喻 (path metaphor) 的 角度 来 看 ,原来 的 职务 是 
源 点 ,后 来 的 职务 是 终点 。 为 了 周全 ,把 这 两 套 语义 角色 的 名 目 都 标 
注 上 去 ,并 用 析 取 号 /来 标记 。 
(iD 语气 副词 “偏偏 > 在 这 里 表示 转折 关系 ,有 语 篇 衔接 功能 。 
所 以 需要 标注 。 
C43) (经 查 }u,[ 张 斌 昌 ,]A{ 在 ([ei]ex 任 [酒家 钢铁 集团 公 
司 副 总 经 理 ]&) 期 间 }1; 利 用 [职权 Jev[s]A 多 次 收受 [他 大 贿 
赂 的 现金 、 国 库 券 等 折合 人 民 币 80 多 万 元 ]P。{(1995 年 ; 8 
月 )zry{([ 张 斌 昌 ijex 调 任 [ 兰 州 钢铁 集团 总 经 理 ]ge) 后 }jr,[Lej]A 
(于 同年 11 月 }r[ 向 菜 外 方 合资 企业 董事 长 ] 索要 [[ 人 民 
币 ]mLV]E5 五 元 Je]。 


说 明 : (i 为 了 简单 ,我 们 假定 “人民 币 5 万 元 ”中 隐 含 了 “ 达 " 一 
类 动词 ,并 据 此 标定 “人 民 币 ? 和 ”5 万 元 ?的 论 旨 角色 。 


(44) [ 史 有 虎 ]e{1987 年 8 月 } 调任 [市 委 农 工 部 副 部 长 、 
农业 委员 会 副 主 任 ]Jw 。{ 在 多 年 的 工作 中 j7,[ 史 有 旧 ， 给 人 的 
印象 mm 是 [就 克 业 业 ]se,[ei]m 是 [个 出 了 名 的 “老实 部 长 "]we。 
说 明 : (iD 这 里 的 成 语 “ 欧 兢 业 业 ” 是 谓词 性 的 ,在 论 旨 角色 上 可 

以 归 和 人 系 事 。 

(45a)[ 印 城 国 ; 的 职务 ja {《 虽 } cssi 人 机 千 为 [分 管 月 
籍 、 外 勤 的 副 所 长 je 但)veei[ 他 让]A 还 是 { 按照 原 来 的 那样 )w 
做 [PROJ]eg”,Lei^ 经 常 深入 [ 辖 区 小 9 [ex { 为 实现 辖区 发 案 
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少 、 秩 序 好 、 群 众 满意 }Ai 而 努力 。{1997 年 jr7,[ 疮 域 国 ]A 收 到 

[4000 多 封 群众 来 信 ]p。[ 对 于 自己 ; 职责 范围 之 内 又 能 办 得 到 

的 事 ]jg,[ 抢 娥 国门 A 都 尽力 去 做 。 

说 明 : 〈i) 动词 “做 ?后面 省 去 了 受 事 或 结果 一 类 客体 论 元 。 

(ii) 这 里 的 时 间 副 词 “ 已 ”确实 是 一 个 表示 过 去 时 的 虚词 ， 

(iii) 表示 转折 关系 的 连词 “ 虽 …… 但 ……” 是 篇 章 关联 词语 。 
对 于 这 种 配套 的 有 条 件 关 系 的 连词 , 一 种 标记 法 是 直接 把 它们 标记 
为 篇 章 关联 词 语 ,并 加 上 相同 的 下 标 ,以 示 它 们 之 间 的 条 件 关 系 ; 另 
一 种 标记 法 是 分 别 在 这 种 关联 词语 下 面 加 着 重点 ,把 它们 关联 的 小 
句 或 句子 用 花 括号 套 起 来 ,并 在 其 后 标注 条 件 (CON) 和 结果 (CSQ) 
等 逻辑 语义 关系 ,如 下 面 所 示 


(45b) {[L 欠 娥 国 ; 的 职务 ]ewrh 虽 《 已 ms 升 为 [分 管 户 籍 、 外 
勤 的 副 所 长 jwe，jcsi{ 但 [他 ]。 还 是 {* 按 照 原来 的 那样 ju 做 
[PRO]awg”，[ei]A 经 常 深入 [辖区 ],[ei]A (为 实现 辖区 发 案 少 、 
秩序 好 、 群 众 满意 }Ai 而 努力 。}vegi{1997 年 )7,[ 部 娥 国 ]A 收 到 
[4000 多 封 群众 来 信 ]。[ 对 于 自己 ; 职责 范围 之 内 又 能 办 得 到 
的 事 ]w,[ 逆 培 国 ]]A 都 尽力 去 做 。 

(46a)[ 利 维 ]\{ 当 天 ， 下 午 )r{ 在 特 壮 维 夫 }， 宣布 ,[{ 由 于 
[内 塔 尼 亚 胡 ]A( 未 )ue 人 (( 能 ?aod{[ 对 他 ; 所 提出 的 一 些 修改 1998 
年 度 国家 预算 的 要 求 ]ge 作 出 [答复 ])) )gs,[ 他 让 A 决定 [Leije 
辞去 [外 长 职务 ]Re]Re]Re。 


说 明 : 〈i) 指示 词 “ 当 天 ?参照 词语 要 到 上 文中 去 找 。 

《iD 因为 "由 于 ?引导 的 原因 小 句 及 相应 的 结果 小 句 联 合 起 来 作 
动词 宣布 ?的 系 事 宾语 ,并 且 结 果 小 句 又 没有 出 现 连词 ;所 以 ,可 以 
简单 地 把 原因 小 句 处 理 为 原因 论 元 。 当 然 ,也 可 以 分 别处 理 为 原因 
小 句 和 结果 小 句 , 作 如 下 这 种 标注 处 理 ; 

(46b)[ 利 维 ]A{ 当 天 ， 下 午 }jr{ 在 特拉维夫 }): 宣布 ,[{ 由 于 

[内 塔 尼 亚 胡 ]A( 未 ?ug{( 能 ?wa{[ 对 他 ; 所 提出 的 一 些 修改 1998 

年 度 国家 预算 的 要 求 ]Re 作 出 [答复 玉 }}}cas, 人 [他 i]A 决定 
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[Lei]e 侠 去 [外 长 职务 jge]。 }csa je o 


说 明 : (i) 在 这 里 ,原因 小 名 (cause clause) 记 作 CAS, 结 果 小 句 
(consequence clause) 记 作 CSQ。 

(ii) 这 里 的 第 一 个 人 称 代 词 “ 他 ”的 先行 语 不 是 前 面 邻 近 的 人 名 
“内 塔 尼 亚 胡 ”而 是 句 首 的 人 名 “ 利 维 ?。 这 种 代词 照应 的 求解 规则 ， 
要 用 到 高 话题 性 这 一 概念 。 可 以 大 概 地 表述 如 下 : 如 果 代 词 有 几 个 
候选 的 先行 语 ,那么 高 话题 性 的 成 分 优先 。 至 于 话题 性 的 高 下 ,至 少 
有 语法 地 位 、 语 法 位 置 有 定性 等 指标 。 一 般 地 说 , 主语 之 宾语 , 主 名 
二 从句, 邻近 之 远程 ,有 定之 无 定 , 旧 信息 之 新 信息 ,等 等 。 在 本 例 
中 , 利 维 ? 是 主 句 主语 ,内 塔 尼 亚 胡 ”是 从 名 主语 ;但 是 ,后 者 更 邻近 
“他 >”。 因 此 ,事实 上 ,如 果 纯 粹 从 结构 上 看 ,他 ”在 照应 关系 上 是 有 
歧义 的 。 比 如 ,只 要 把 “答复 ? 改 成 “说 明 ”, 再 把 主 句 的 宾语 从 句 作 一 
些 调整 ,就 可 以 让 “他 ? 回 指 “ 内 塔 尼 亚 胡 ”。 例 如 : 


(46c)[ 利 维 ]A{ 当 天 ,下午 }z{ 在 特拉维夫 })L 宣布 [{ 由 于 
[内 塔 尼 亚 胡 ij]A(〈 未 ne {( 能 ?wa 人 对 他 | 所 提出 的 一 些 修改 
1998 年 度 国 家 预算 的 要 求 ]ne 作出 [说 明 ]R}} }cas,{[ 他 | 内 决定 
[[ei]e 搁 置 [这 项 要 求 下 jaejcsajRe。 


说 明 : (iD 在 这 里 ,两 个 “他 ?分别 跟 不 同 的 人 名 发 生 回 指 关系 : 
从 句 中 的 “他 ?跟从 句 中 的 人 名 发 生 回 指 关系 , 主 句 中 的 “他 ? 跟 主 名 
中 的 人 名 发 生 回 指 关 系 。 


(47) {1992 年 jz,[ 刘 涛 A 进入 [江西 农用 机 械 厂 . Leij]ex 
成 为 [总 工程 师 jRe。 


2 新 闻 短 讯 的 语义 标注 


这 些 文本 都 是 新 闻 报 道中 的 比较 完整 的 短 讯 , 或 者 是 完整 的 报 
道中 摘 取 出 来 的 句子 ,主题 都 是 关于 职务 变动 的 。 来自 网 上 检索 到 
的 关于 职务 变动 的 新 闻 报 道 。 这 些 文本 的 编号 原文 没有 ,是 我 们 为 
了 查找 和 核对 的 方便 而 加 上 去 的 。 
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(1)[ 原 中 联 办 主任 姜 思 柱 ]& 获 任 [ 人 大 外 事 委 副 主任 委 
员 jg。。( 南 方 网 ) 
〈2) [现任 信息 产业 部 部 长 王 旭 东 j]ex 接 任 [ 国 信 办 主任 一 
职 ]ge。( 南 方 网 ) 
〈3) [ 黄 卫 ;jex 任 [建设 部 副 部 长 jge,[ei]sx( 不 ?us 再 担任 [ 江 
苏 省 副 省 长 职务 jge。 (南方 网 ) 
《4) {9 月 7 日 )})7，,[ 铁 道 通信 信息 有 限 责 任 公司 ]m 发 生 [ 重 
大 人 事变 动 ]ge。[ 原 总 经 理 彭 朋 ]sx{ 经 [董事 会 ; 大 召 开 [ 临 时 会 
议 ]R)w ,被 [ei]A 解除 [职务 ]kwP,[ 新 任 铁通 公司 总 老 经 理 ]w [由 
乔 金 洲 ] 担 任 。( 新 浪 网 ) 
说 明 :〈i) 为 了 简单 和 方便 ,可 以 把 “解除 职务 ”看 作 是 一 个 动词 
性 成 分 而 不 加 分 析 。 因 为 ,在 结构 和 语义 上 , 述 宾 结构 “解除 职务 ”大 
致 相当 于 动词 “解职 ”。 当 然 , 为 了 分 析 的 彻底 ,也 可 以 把 “职务 ”看 作 
是 一 个 比较 抽象 的 系 事 论 元 。 这 样 ,可 以 使 论 元 结构 关系 的 分 析 真 
正 地 落实 到 以 动词 为 单位 ,并 且 是 以 动词 为 中 心 。 
〈ii) 对 于 动词 "解除 ?来 说 “职务 ”的 论 旨 角色 是 受 事 ; 但 是 ,为 
了 跟 担 任 动词 的 客体 论 元 (其 论 旨 角色 为 系 事 ) 协 调 , 也 可 以 标定 为 
系 事 。 “解除 ?是 个 双 宾 语 动词 ,在 本 例 中 与 事 宾语 通过 被 动 化 而 前 
置 于 动词 , 受 事 ( 或 系 事 ) 宾 语 留 在 原 位 。 
(5) [ 驻 港 部 队 司令 员 ijirwverge 调 整 ,[ 能 自 仁 jgx 离 任 ,[ 王 继 
堂 ]sx* 接 任 [ei]se。 (南方 网 ) 


说 明 : (iD“ 驻 港 部 队 司令 员 ” 对 于 “调整 > 来 说 ,其 论 旨 角 色 可 以 
笼统 地 归 入 主事 。 但 是 ,如 果 追 求 语义 角色 关系 的 精密 ;那么 “调整 > 
应 该 有 一 个 施 事 ,在 本 例 中 被 省 略 了 ,参看 下 面 例 (12) 。 于 是 “调整 
的 对 象 “ 驻 港 部 队 司令 员 ” 是 客体 论 元 ;可 以 归 入 受 事 。 当 然 , 为 了 在 
整个 句子 中 使 其 语义 角色 相对 统一 ,也 可 以 归 人 和 人 系 事 。 

(iD “ 离 任 ” 的 意思 是 离开 原来 担任 的 职务 , 即 不 再 担任 这 一 职 
务 ; 是 一 个 不 及 物 动词 ,在 结构 上 不 能 带 宾语 。 但 是 , 它 在 语义 上 确 
实 隐 含 了 一 个 系 事 性 成 分 ,在 这 里 是 “ 驻 港 部 队 司令 员 ”。 而 “接任 ” 
的 意思 是 接替 职务 ,是 一 个 及 物 动词 ;在 结构 上 省 略 了 一 个 系 事 宾 
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语 ,在 这 里 是 “ 驻 港 部 队 司令 员 ”。 可 见 , 意 义 相同 或 相反 的 动词 ,其 
配 位 能 力 有 时 差别 很 大 。 


(6) [中共 了 A 免 去 [ 张 文 康 ]jex[ 卫 生 部 党 组 书记 职务 jge， 
[高 强 je: 继 任 。 (南方 网 ) 


说 明 : iD“ 继任” 的 意思 是 接替 前 任 的 职务 , 跟 上 例 中 的 “ 离 任 ” 
一 样 , 是 一 个 不 及 物 动词 ,在 结构 上 不 能 带 宾 语 。 但 是 ,在 语义 上 确 
实 隐 含 了 一 个 系 事 性 成 分 ,在 这 里 是 “卫生 部 党 组 书记 职务 ”。 


7) [ 原 北 大 副 校 长 陈 章良 jex 任 [中 国 农 大 校长 je。《 南 方 
网 ) 


说 明 : GD 这 里 通过 经 事 论 元 中 的 修饰 语 ,表示 这 不 是 一 个 简单 
的 担任 事件 ,而 是 一 个 由 离 任 和 新 任 两 个 事件 复合 成 的 调任 事件 。 


(8) [人 大 常委 会 ]\ 通过 [一 批 免 职 与 任命 名 单 ]。《 南 广 
网 ) 


说 明 : (iD 在 本 例 中 ,动词 “免职 "和 "任命 "都 是 名 动词 ,直接 修 
饰 名 词 ,表示 一 种 属性 ;因此 ,不 必 为 它们 标注 论 旨 角色 关系 。 


(9) [曾庆红 i]A 接替 [胡锦涛 ]e{[ei]x 兼 任 [ 中 央 党 校 校 
长 ]ge}》。 (南方 网 ) 


说 明 : (D 这 种 标注 方式 ,是 认为 连 谓 结构 的 后 段 省 略 或 隐 含 了 
一 个 跟前 段 的 主语 同 指 的 经 事 成 分 。 当 然 * 为 了 简单 ,对 这 种 中 间 不 
用 逗号 点 断 的 连 谓 结构 , 当 其 中 不 同 的 动词 性 成 分 的 主体 论 元 相同 
时 ,后续 动 词性 成 分 空缺 的 主体 论 元 可 以 不 作 标记 。 即 完全 可 以 由 
某 种 缺 省 性 句法 .语义 规则 来 处 理 。 
《10) [新 当选 的 中 央 政 治 局 常委 ]A[ 与 中 外 记者 jp 见面 。 
《南方 网 ) 


说 明 : (iD 准 三 元 动词 通常 用 “和 、 同 ` 跟 、 与 ?引进 其 与 事 论 元 。 


(11) [陕西 体育 ) 彩 ( 票 ) 中 心 领 导 班子 ]p 被 [ey]。 勒令 辞 
职 。( 南 方 网 ) 
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说 明 : (D 为 了 简单 和 方便 ， 勤 令 ? 跟 其 后 面 的 动词 可 以 看 作 是 
一 个 动词 性 的 结构 而 不 加 分 析 。 
ii) 我 们 用 [e* ] 标 记 在 本 段 中 先行 语 不 明确 的 空 语 类 。 


由 态 | [国务 院 ]^。 调整 [三 峡 工 程 建设 委员 会 ]p,[ 温 家 宝 jx 
兼任 [主任 jse。 (南方 网 ) 


3 新闻 全 文 的 语义 标注 


这 些 文本 都 是 新 闻 报 道 的 全 文 , 来 自 网 上 检索 到 的 关于 职务 变 
动 的 新 闻 报 道 。 这 些 文本 的 编号 和 标题 前 的 “ 副 ) 标 题 (17/2) 字样 ， 
原文 没有 ,是 我 们 为 了 查找 和 核对 的 方便 而 加 上 去 的 。 


(1) 标题 :[ 俄 罗斯 第 一 副 外 长 jiveme 罗 人 [ 阿 夫 杰 耶 夫 ]P 
被 Le 解除 [职务 jn。 

[新 华 网 ]x{ 莫 斯 科 六 (2 月 -23 日 f) 专电 [俄罗斯 总 统 普 
京 i]A{23 日 } 签署 [命令 ]g, [sj 解除 [ 亚 历 山大 。 阿 夫 杰 耶 
夫 的 第 一 副 外 长 职务 jwge，,{ 同 时 ij) 任命 [ 瓦 列 里 "。 洛 希 宁 ] 了 
为 [第 一 副 外 长 we。 

[ 俄 塔 (斯 ) 社 kj 援引 [总 统 新 闻 秘 书 格 罗 英 夫 的 话 
[ee ja 说 ， [ 阿 夫 杰 耶 夫 ]m 另 有 任用 。 { 据 可 靠 人 士 透 吉 } }w,L 阿 
雪 赤 屠 志 as (将 us 出 任 [俄罗斯 驻 法 国 大 使 ]se。 〈 新 华 网 ) 


说 明 : (i) 为 了 简单 ,我 们 把 * 易 人 ?看 作 是 一 个 动词 ,其 意义 是 : 
(职务 等 ) 更 换 担当 者 ;类 似 于 动词 “易手 ,其 意义 是 :〈 政 权 、 财 产 
等 ) 更 换 占 有 者 。 另 外 ，“ 易 人 ?的 意思 跟 第 2 部 分 例 (5)(12) 中 的 “ 调 

整 ? 相 似 , 但 是 “调整 ?是 及 物 动 词 , 各 从 属 成 分 的 论 旨 角色 关系 比较 
明显 ;而 “ 易 人 ”是 不 及 物 动 词 , 其 主语 的 论 旨 角色 很 不 明朗 , 既 像 是 
主事 .又 像 是 受 事 或 系 事 。 这 里 为 了 周全 ,以 析 取 形式 都 标注 上 去 
了 

(ii) 根据 (现代 汉语 词典 》“ 专 电 ” 的 意思 是 : 记者 专 为 本 报社 
报道 新 闻 而 由 外 地 用 电话 .电报 、. 电 传 发 来 的 稿子 ,区 别 于 通讯 社 供 
稿 。 因 此 “新 华 网 莫斯科 2 月 23 日 专电 ”的 意思 是 : 新 华 网 记者 从 
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莫斯科 于 2 月 23 日 发 出 的 专电 。 为 了 标注 的 简单 和 语义 角色 关系 
的 清晰 ,我 们 暂时 忽略 其 中 的 名 词 化 之 后 的 指称 性 意义 ,而 径直 标注 
其 名 词 化 之 前 的 谓词 性 结构 的 陈述 性 意义 关系 。 也 就 是 说 ,姑且 把 
这 里 的 “专电 ?解释 为 “发 出 专电 ”。 参 见 第 1 部 分 第 (1) 例 的 说 明 中 
对 “ 电 ? 的 解释 。 

ii“ 亚历山大 。 阿 夫 杰 耶 夫 的 第 一 副 外 长 职务 ?对 于 动词 
“解除 ?来 说 ,其 论 旨 角色 应 该 是 受 事 ; 但 是 ,为 了 跟 其 他 职务 变更 
动词 的 论 元 的 论 旨 角色 相对 应 和 一 致 ,这 里 同时 标注 上 系 事 这 种 
角色 。 

Civ)“ 同 时 ?是 一 个 时 间 指 示 词 ,其 更 完整 的 形式 是 “与 此 同 
时 ”; 因 此 ,应 该 标注 其 参照 关系 。 参 看 第 7 例 第 7 段 开 头 的 “与 此 同 
时 ”。 

v) 我 们 把 “ 另 有 安排 ?一 类 动词 性 结构 看 作 一 个 整体 而 不 加 语 
义 关 系 分 析 。 

vi) 从 篇 章 结构 上 看 ,这 篇 报道 分 为 上 下 两 个 段落 ,第 一 段 有 
三 个 小 句 : 第 一 小 句 总 提 "“ 签 署 命令 ”, 接 下 来 两 个 小 名 说 明 命令 的 
具体 内 容 是 任免 (…… 解 除 ……,…… 任 命 ……); 其 中 ;最 后 二 个 小 
名 用 时 间 指 示 词 “同时 ?来 充当 时 间 论 元 ,并 起 到 衔接 上 下 文 的 作用 。 
第 二 段 交 代 被 免职 者 的 出 路 ,分 别 用 两 个 句子 ,从 不 同 的 消息 渠道 由 
模糊 到 清晰 地 说 明 被 免职 者 “ 另 有 任用 ”和 任用 的 机 构 及 其 职务 ( 驻 
法 大 使 ) 。 


《2) 标题 : 全 宝马? 假 彩 案 }rop : 人 [陕西 体彩 中 心 主任 员 安 
庆 下 被 [es]A 撤职 }cow 

[中 新 网 ]A{5 月 11 日 jr 电 { 据 央视 国际 消息 )w,[ 陕 西 省 
体育 局 jj]A{ 今 天 ;}r[ 对 陕西 体 ( 育 ) 彩 ( 票 ) 中 心 主 任 贡 安庆 ]bx 
作出 [撤职 的 决定 ]w。 

[C[ 贾 安庆 jg 被 Le]A 撤职 的 ) 原 因 ]m 是 [L{3 漂 -23 亲 款 
(在 ([ 西 安 市 即 开 型 体育 彩票 ] 发 售 ) 过 程 中 }r,{ 由 于 [体彩 部 
门 品 A 用 [人 jj]m 失 察 `LLes]A 监管 LPROje nm 不力.{ 加 之 }App 
[相关 法 律 ]m《〈 不 ?os{ 够 健全 } jn， 出 现 ( 了 )mef[ 假 彩票 事件 se， 
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[el]^ 损 害 4 可 : 六 大 彩 民 的 权益 ]， { 更 }Apo[e]s 损 害 
《了 )per[ 政 府 的 信誉 jp,[el]A{ 在 社会 上 六 造成 (了 ?wet[ 严 重 影 
响 ] je。 

[ 目 前 jzr,L 杨 永明 等 3 名 涉案 人 员 ] 被 [eu]^ 刑事 拘留 ， 
[陕西 省 和 西安 市 ]A 要 求 [[ 公 安 机 关 。]A 加 大 [案件 侦破 力 
度 ],[en]^ 尽快 破案 ]jRe。 〈 中 新 网 ) 


说 明 :〈i) 从 话语 结构 上 看 ,在 标题 中 ,宝马 ? 假 彩 案 ? 是 背景 
性 话题 ,相应 地 后 面 的 句子 “陕西 体彩 中 心 主任 页 安庆 被 撤职 ?是 说 
明 部 分 ,用 以 交代 处 理 的 结果 。 

(ii) 为 了 简单 ,我 们 把 “刑事 拘留 ?看 作 是 一 个 动词 性 结构 而 不 
加 分 析 。 

Ciii) 从 篇 章 结构 上 看 ,这 篇 报道 共有 三 个 段落 ,第 一 段 只 有 一 
名 ,总 提 贾 安庆 被 撤职 事件 ;第 二 段 是 一 个 由 一 连 串 小 句 组 成 的 大 
名 ,具体 介绍 页 安 庆 被 撤职 的 原因 ;第 三 段 交 代 其 他 相关 类 员 的 处 理 
结果 。 这 三 个 段落 的 衔接 很 具 特 色 ,第 二 段 通过 把 第 一 段 中 报道 的 
前 景 信 息 (foreground information)“ 贾 安庆 被 撤职 ”名 词 化 为 “的 ” 字 
结构 ,再 作 “ 原 因 ” 的 定语 , 即 处 理 为 话题 性 背景 信息 (background 
information), 从 而 自然 地 把 这 两 个 段落 联结 起 来 。 第 三 段 则 用 " 涉 
案 人 员 ” 这 种 隐 性 的 指示 性 词语 (特别 是 其 中 的 “ 案 ”) 来 回 指 第 三 段 
中 的 “ 假 彩 票 事件 >, 从 而 在 语义 上 把 这 两 个 段落 也 衔接 起 来 了 。 当 
然 , 上 述 这 些 衔 接手 段 都 比较 隐蔽 ,并 且 不 易于 形式 化 表示 。 相 对 地 
说 ,小 句 和 句子 之 间 的 衔接 就 比较 紧密 ,也 具有 较 多 的 词汇 或 结构 形 
式 手 段 ; 比 如 上 例 第 二 段 中 用 了 “由 于 .加 之 .更 ”等 语 篇 关联 词语 。 


(3) 标题 : {[e*]^ 违规 调 人 }m [咸阳 va 
定 会 ]prgx [被 人 大 ]^ 撤消 [职务 ]w 

[新 华 网 ]A{ 西 安 ) 16 月 14 日 }r 电 ([L 记 者 边 江 ]ALVJ])L 陕 
西 省 咸阳 市 第 四 届 人 民 代 表 大 会 常务 委员 会 ; 第 26 次 会 议 ]^ 
{13 日 ) 通过 ( 汪 )pae[( 关 于 (Le 撤消 [ 张 定 会 jex[ 咸 阳 市 人 
民政 府 副 市 长 的) 决定 jge。 

{1999 年 前 后 jjr[ 张 定 会 jex 任 [陕西 省 形 县 县 委 书 记 ]e。 
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{ 在 此 期 间 j}T,[L 工 商 系统 ]^ 实行 [体制 改革 jprwRgy 人 L 原 由 地 方 
政府 开支 的 管理 的 各 级 工商 部 门 ] 实行 [垂直 管理 jwwg jx， 
[入 有 到 称 [ek]e 为 [上 划 ”j&。 {L 彬 县 工商 局 |]m{ 重 直上 划 
迹 程 中 )r ;存在 [([ei]A 严重 违规 ,[a]A 突击 进 人 [70 多 名 ]w 和 
[领导 干部 ]A 弄 虑 作假 、 以 权谋 私 的 ) 问 题 ]&ja,[ 对 此 s]m[ 张 
定 会 ]m 负 有 [直接 领导 责任 ]w 。{ 根 据 ( 中 华人 民 共 和 国 地 方 各 
级 人 民 代 表 大 会 和 地 方 各 级 人 民政 府 组 织 法 》 的 有 关 规 定 }w， 
[咸阳 市 人 大 常委 会 ]A 决定 [LeiA 撤消 [ 张 定 会 jex[ 副 市 长 职 
务 ]ge]ke。 

[与 彬 县 工商 局 违规 调 人 问题 有 关 的 其 他 数 名 干部 ]m 
{ 也 }oog 受 到 [相应 的 党 纪 政 纪 处 分 ]w 。( 新 华 网 ) 


说 明 :《〈i) 相对 于 后 面 的 “咸阳 市 人 民政 府 副 市 长 张 定 会 被 人 大 
撤消 职务 "违规 调 人 ”的 论 旨 角色 可 以 归 入 原因。 当然 ,也 可 以 把 
它 处 理 为 原因 小 句 。 

Gil“ 体 制 改 革 ” 和 "垂直 管理 ?对 于 动词 “实行 ?来 说 ,其 论 绅 角 
色 既 像 是 受 事 ,又 像 是 方式 ,还 有 点 儿 像 是 结果 。 为 了 周全 ,一 并 以 
析 取 的 方式 标注 出 来 。 

《2“ 称 为 "可 以 看 作 是 “ 称 之 为 ”的 省 略 形式 ,这 个 被 省 略 掉 的 
空 语 类 是 受 事 论 元 ,其 先行 语 是 前 面 的 整个 句子 。 

Civ)“ 对 此 ”的 “此 ?* 回 指 前 面 的 一 个 大 句 “ 彬 县 工商 局 垂直 上 划 
过 程 中 ,存在 严重 违规 .突击 进 人 70 多 名 和 领导 干部 弄虚作假 `. 以 权 
谋私 的 问题 ”。 

(v) 从 篇 章 结构 上 看 ,这 篇 报道 共有 三 个 段落 ,第 一 段 只 有 一 
句 ,总 提成 阳 市 人 大 撤消 张 定 会 副 市 长 职务 ;第 二 段 由 四 个 句子 组 
成 ,具体 介绍 张 定 会 被 撤职 的 原因 ;第 三 段 交 代 其 他 相关 人 员 的 处 理 
结果 。 这 三 个 段落 的 衔接 都 缺少 显 性 的 表层 结构 上 的 标志 ,但 是 符 
合 撤职 类 报道 的 章法 : 先 总 提 撤 职 事件 ,次 述 撤职 原因 ,后 说 相关 处 
理 。 


(4) 标题 : [两 名 全 国人 大 代表 上 ep{ 因 [ei]A 涉嫌 [贿选 和 收 
受贿 赂 jge)ma 被 [Ley ]^ 罢免 


新 闻 语 体 真 实 文本 的 语义 标注 的 实践 331 


[新 华 网 ]{ 北 京 六 {12 月 27 日 jz 电 ([ 记 者 赵 须 重 娜 ]^ 
LVJ){ 根 据 十 届 全 国人 大 常委 会 第 六 次 会 议 27 日 发 布 的 公 
告 jw，* 分 别 { 因 [ei]m 涉 嫌 [ 贿 选 和 收受 贿 落 je。 }ayE 来 自 湖南 和 
四 川 的 陈 满 生 、 导 良 钟 问 p 被 [ey ]A 多 父 终止 [全 国人 大 代表 资格 jse。 

(经 查证 jw: [ 原 任 湖南 省 计划 生育 委员 会 主任 \ 第 十 届 全 
全 ci 
违反 [规定 jge，[Leij]A 利 利用 [职务 上 的 便利 jg,{ 通 过 请 客 、 送 
礼 })w,[eJA 组 织 和 动员 [本 机 关 及 本 系 统 的 干部 jseay{ 为 自己 i 
当选 全 国人 大 代表 }Ai 拉 [选票 jp。 [湖南 省 人 大 常委 会 u]A{9 月 
28. 昌 这 通过 [决定 :je， (Lek]A 罢免 [其 i 全 国人 大 代表 职 
务 ]gej [er]A{ 并 }App 决 定 [Lek] 提请 [全 国人 大 常委 会 代表 资 
格 审查 委员 会 jpeaA 审 查 Leljp]ke。 

[于 良 钟 o]( 原 ?ps 任 [四 川 省 内 江 市 市 长 jse,[ 他 wjsx{ 因 
[ea 接受 [贿赂 jp}m 被 [en ]、 依法 撤消 职务 。 [四 川 省 十 届 人 
大 常委 会 四 次 会 议 ， ]{ 于 7 并 药理 汽 通过 [村 锡 案 ],[eu]。 村 
免 [ 导 良 钟 ]e.[ 十 局 全 国人 大 代表 职务 ] ， 

[公告 外 还 确认 (了 yeea[[ 来 自 福建 的 何 锦 龙 和 江西 的 刘 和 
平 的 全 国 从 大 代表 资格 ] 了 有 效 ]i 。 { 自 十 届 全 国人 大 一 次 会 议 
以 来 }T 久 已 经 ps 有 [ 余 小 平 : 区 来 贺 竺 7 名 全 国 大 大 代 规 ]Re&Th 
志 世 。 

{ 现 在 jzr,[ 十 届 全 国人 民 代 表 大 会 ]m 实 有 [代表 jesrmnLV] 
[2977 从 jg。( 完 )( 来 源 : 新 华 网 ) 


说 明 : (iD 对 应 叙述 同一 个 主语 的 一 连 串 小 名 ,我 们 尽量 为 每 一 
个 动词 性 成 分 标注 一 个 主语 ,省 略 的 用 空 语 类 补充 出 来 。 

(il“ 涉 嫌 ” 的 意思 是 有 跟 某 件 事情 有 关 的 嫌疑 ,其 客体 论 元 的 
论 旨 和 角色 可 以 归 人 系 事 。“ 通 过 决定 ”中 的 “决定 ? 跟 后 面 的 整个 小 句 
同 指 ;它们 又 跟 动 词 * 审 查 ” 后 面 的 空 语 类 同 指 。 

(ii) 对 于 表示 存在 的 ”有 十 NP 十 VP” 格 式 , 我 们 根据 NP 跟 
“有 ”和 VP 语义 关系 ,分 别 标 注 两 种 论 旨 角色 。 

Civ)“ 通 过 罢免 案 ” 也 可 以 看 作 是 一 个 整体 充当 动词 “罢免 ”的 
方式 论 元 
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'v) 在 “提请 全 国人 大 常委 会 代表 资格 审查 委员 会 审查 ”中 , 兼 
语 式 的 前 段 和 后 段 连 在 一 起 , 兼 语 成 分 “全 国人 大 常委 会 代表 资格 审 
查 委员 会 "被 标注 了 两 种 论 旨 角色 ;在 “组 织 和 动员 本 机 关 及 本 系统 
的 干部 ,为 自己 当选 全 国人 大 代表 拉 选 票 " 中 ,虽然 兼 语 式 的 前 段 和 
后 段 被 逗号 点 断 , 但 是 兼 语 成 分 “本 机 关 及 本 系统 的 干部 ”同样 也 应 
该 标注 两 种 论 旨 角色 。 

SCvi) 从 篇 章 结构 上 看 ,这 篇 报道 共有 五 个 段落 ,第 一 段 只 有 一 
个 大 句 , 总 提 ”“ 陈 满 生 、 导 良 钟 被 终止 全 国人 大 代表 资格 ”并 通过 原 
因 论 元 分别 涉嫌 贿选 和 收受 贿 落 ?交代 原因 ;第 二 、 三 两 个 段落 都 是 
由 两 个 大 名 组成, 分别 具体 介绍 他 们 的 贿选 和 收受 贿 落 、 和 被 当地 人 
大 罢免 ;第 四 五 两 段 交 代 其 他 人 大 代表 的 情况 。 这 五 个 段落 的 衔接 
都 缺少 显 性 的 表层 结构 上 的 标志 ,但 是 符合 撤职 类 报道 的 章法 : 先 
总 提 撤 职 事件 ,次 述 撤职 原因 ,后 说 相关 事项 。 


(5) 标题 : [田凤山 被 Ley]^ 免 去 [职务 je[ 和 孙文盛 ]^ 出 
任 [国土 资源 部 部 长 ]w。 

副标题 1: 孙文盛 jex 出 任 [国土 资源 部 部 长 ]s。 

[十 届 全 国人 大 常委 会 第 五 次 会 议 (]A{28 日 下 午 )7{ 通 过 表 
决 }w, 决 定 [Lei] 任命 [孙文盛 ]s, 为 [ 国 土 资 源 部 部 长 jj]e。 

[和 孙文盛 ijex， 男 ,Lej]eeLV]L61 岁 ]ge,[esj]eLV][ 山 东 威 海 
人 je,[Lejss LV]L 大 学 学 历 ]g，, [es [EV][ 工 程 师 ]ne。 [sei]e: 
〈 曾 mst 任 [湖南 省 委 副 书 记 , 山 西 省 委 副 书记 、 省 长 ]ge，{1999 
年 后 } 工 [sije 任 [国土 资源 部 副 部 长 ( 正 部 长 级 ) ]we。 

副标题 2; [田凤山 ]P{ 因 违纪 }an 被 [si]A 免 去 [国土 资源 部 
部 长 职务 ]m 

[十 局 全 国人 大 常委 会 第 五 次 会 议 ]A{28 日 jr{ 经 表决 jw 
通过 [决定 jge,[ei]A 免 去 [田凤山 的 国土 资源 部 部 长 职务 ]ei 
[ei]^ 任命 [和 孙文盛] 忆 为 [ 国 土 资源 部 部 长 ]ke。 [国务 院 ]^{ 在 提 
请 任免 的 文件 中 五 说 ,[ [田凤山 同志 jp{ 因 有 严重 违纪 问 
题 }jts,( 正 在 pei 调查。”]w 

[田凤山 ijex,{(1940 年 10 月 )7 出 生 于 [黑龙 江 省 擎 源 县 下 ， 
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[es]s:LV][ 大 专文 化 ]ge。{1988 年 后 jr[e]ex 任 [牡丹 江 市 市 委 
书记 、 黑 龙 江 省 副 省 长 .哈尔滨 市 市 委 书记 、 中 共 黑 龙 江 省 省 委 
副 书 记 、 省 长 ]gs。{(2000 年 3 月 })r[ejsxe 任 [国土 资源 部 部 
长 ]R。 

[新 任国 土 资 源 部 部 长 孙文盛 js,{(1942 年 2 月 ) 生 ， 
[esjeLV][ 山 东 威 海 人 jge,[esjsLV]L 大 学 学 历 ]se,[eksjeLV] 
[工程 师 jge。{1983 年 5 月 后 }7[Lekjex 任 [中 共 株 州 市 委 书记 、 
中 共 湖南 省 委 副 书记 等 职务 jge。{1993 年 9 月 起 }7[ekjex 任 
[中 共 山 西 省 委 副 书 记 、 副 省 长 、 代 省 长 .省 长 jg 。{(1999 年 6 月 
起 }7[Lekje 任 [国土 资源 部 副 部 长 jge。 {2003 年 10 月 })[Lekj]s 
任 [党 组 书记 Js 。([ 记 者 赵 爱 韩 旬 ]A[V]) 

新 华 网 2003 年 10 月 28 日 (中 国 网 ) 


说 明 : GD“ 免 去 职务 ”也 可 以 作为 一 个 动词 性 结构 ,不作 语 义 关 
系 的 分 析 。 以 便 跟 * 免 职 ,去职 .离职 ?等 动词 相对 应 。 

(ii) 也 可 以 把 “十 届 全 国人 大 常委 会 第 五 次 会 议 28 日 下 午 通过 
表决 ”分析 为 一 个 小 句 , 于 是 ,后 面 的 “Le 决定 [ej 任 命 [孙文盛 je 
为 [国土 资源 部 部 长 jse jg。 ” 便 要 分 析 为 承 前 省 略 了 主语 。 

5iii) 为 了 证 每 一 个 动词 都 构成 一 个 论 元 结构 ,所 以 把 承 上 省 略 
的 主体 论 元 都 以 空 语 类 的 形式 补充 出 来 了 。 为 了 简单 ,可 以 认为 一 
般 只 能 作 定语 的 区 别 词 “ 男 ”, 在 新 闻 等 语 体 中 可 以 作 谓语 ,在 词类 属 
性 上 临时 有 了 动词 的 功能 。 

Civ) 在 “ 田 风 山 同志 因 有 严重 违纪 间 题 ， 正在 调查 ”中 , 直接 以 
动词 的 主动 形式 来 表示 主语 的 被 动 意义 ;因此 ,这 个 主语 应 该 标记 为 
受 事 。 这 也 许 是 在 新 闻 语 体 等 特定 语 境 中 才 有 的 语法 现象 。 

Cv) 这 本 来 是 两 篇 独立 的 报道 ,后 来 被 网 络 编辑 按照 主题 辑 合 
到 一 起 ,并 加 了 大 标题 ,但 仍然 保持 原 报道 的 标题 ( 变 成 了 小 标题 ) 。 
其 中 ,第 一 篇 是 报道 任命 事件 ,共有 两 段 : 第 一 段 总 说 孙文盛 被 任 
命 , 第 二 段 介 绍 其 主要 生平 事迹 。 符 合 一 般 任命 性 报道 的 篇 章 结 构 。 
第 二 篇 是 任免 报道 ,共有 三 段 : 第 一 段 总 说 田凤山 被 免职 ` 孙 文 盛 被 
任命 ,第 二 、 三 段 分 别 介绍 他 们 的 主要 生平 事迹 。 也 符合 一 般 任 命 性 
报道 的 篇 章 结构 。 总 的 来 说 ,段落 之 间 的 衔接 ,缺少 表层 结构 上 显 性 
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的 标志 。 


(6) 标题 : [高 强 ]^ 澄清 : [LLL 张 文康 ]P 被 [Le ]^A 撤职 ]Jm 完 

全 正确 ]w 
孙 传 炜 (北京 特派 员 ) 

[中 国 卫生 部 常务 副 部 长 高 强 ]。 说 ,[“[ 实 践 ]m 证 明 "， 
[([ 中 国政 府 ]A 撤销 [卫生 部 长 张 文 康 ]evp[ 职 务 ]un 的 ) 决 
定 jm 是 “完全 正确 的 ”jg。 ke]Re。 

[高 强 ;jex{ 近 来 }r{ 因 为 [etjA( 曾 经 ?ms 公开 { 为 张 文 康 }p 说 
好 话 }u 而 遭 到 [ 导 论 批评 js。[ 他 i]A{ 昨 天 }r{([e]A{ 在 记者 会 
上 六 澄清 [自己 的 有 关 谈 话 ]。) 时 )i 说 : [其 实 {[ 大 家 ]A 如 果 
认真 地 读 一 读 [我 在 两 次 新 闻 发 布 会 上 所 披露 出 来 的 中 国 卫生 
工作 存在 的 各 方面 问题 j}supi,{ 就 (能 ?aoa{ 品 味 出 [ 张 文 康 工 作 
中 存在 的 失误 je) )}csaoio”]n。 

[高 强 所 指 的 两 次 新 闻 发 布 会 ]ruR， 分 别 { 在 4 月 20 日 ;和 5 
月 30 日 \jr 举行 。{ 在 第 一 场 发 布 会 上) ,[ 原 末 担 任国 务 院 
副 秘 书 长 的 高 强 ]A 首次 { 以 卫生 部 常务 副 部 长 的 身份 ju 公开 
亮相 。 [他 ]s{ 当 时 ji) 承认 ,[[ 北 京 疫 情 ]m 远 { 比 官府 数据 反映 
的 情况 }ue 严 重 ]w 。[ 新 华 社 ]A{ 在 会 后 不 久 }5 就 宣布 ,[[ 中 共 
中 央 js( 已 经 ?ut 撤除 [ 张 文 康 ]sx[ 在 卫生 部 的 党 职 ]ae]ns。 

{ 不 过 }veg,{ 在 第 二 场 发布 会 。 上 并 ,高 强 jjA{ 却 }vag{ 为 张 
文康 }5 辩护 ， [ex 指 [[ 张 文康 ]A《 没 有 )u 人 隆 胰 [疫情 jee}， 
FL 官 府 数据 ] 少 报 上 疫情] 是 [{ 因为 “当时 wz 的 信息 渠 
道 jmi 人 不 ?asf 畅通 } (难以 )aaa{ 党 握 到 [准确 的 数字 jg)”} 本 村 
致 的 ]R je。 

全 (前 几 天 江 谍 我 站 A{ 还 }apo 看 望 了 at[ 张 文康 先生 jp， 
L 和 他 ,jp{ 就 今后 加 强 中 国 的 公共 卫生 建设 问题 j& 进 行 ( 了 )ued 
[深入 的 探讨 下。 [他 中 s{ 对 我 们 ii? 的 工作 }Re 提 出 (了 >。ea[ 很 多 
很 好 的 建议 ]R。”)4[ 他 ;]A{ 在 有 关 场合 ) 透露 [eu 。 

[高 强 ]A{ 当 时 "}7{ 还 }spp 表 示 [[ei]s( 不 ?us{ 明 白 [{ 为 什 
么 )ga[ 大 家 soL 对 写 信 给 媒体 揭露 真相 的 退休 老 军 医 蒋 彦 永 ]p 
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么 感 兴趣 ]。} ]Re。 

[中 国 媒体 ]A{ 后 来 ,yi 罕见 地 出 现 [([ey]A 间接 甚至 直接 
反驳 [这 位 在 职高 官 言论 ] 的 ) 连 串 报道 ]ke。[《( 财 经 时 报 让 A 
撤 震 ,[[ 经 济 学 者 吴 表 奸 ]A{ 在 给 薪 凑 永 打 电话 表达 故意 时 }T， 
批评 [“{ 现 在 } 有 [一 种 奇谈 怪 论 。 Ja [esj]s 认为 [L 说 老实 
话 ]m 反 倒 有 问题 ， { 而 }veg[L 封 锁 消 息 二 是 正常 的 ,[ep mm 是 [对 
国 家 和 人 民 ] 负责 ]R: 人 

[最 新 一 期 的 (经济 观察 报 门 { 也 }cok 刊 登 ( 了 ud[ 一 入“ 卫 
报 去 职 , 红 良 置疑 "的 文章 ,]p,[eu]A 直 指 [[ 张 文康 ]es 是 { 因 为 
隐瞒 疫情 }e 而 下 台 jee。 

《联合 早报 兴 雅 虎 中 国 ) 


说 明 : iD“ 是 完全 正确 的 ?这 种 “是 .……… 的 2 结构 ， 
语义 标注 方法 ,第 一 种 像 上 例 所 示 , 认 为 “完全 正确 的 ?这 种 “的 ? 字 
构 充 当 系 动 词 “ 是 ”的 系 事 论 元 ;第 二 种 ,如 第 1 Re 
为 “正确 ?是 谓词 核心 “是 ……. 的 ?是 强调 标记 ,可 以 不 作 语 义 ( 论 旨 
角色 ) 关 系 方面 的 标注 。 

Xii)“ 说 好 话 , 感 兴趣 有 问题 ”等 熟 语 性 结构 可 以 作为 一 个 谓词 
性 成 分 而 不 加 论 旨 角 色 关 系 分 析 。“ 读 一 读 ” 等 动词 重 又 形式 处 理 为 
一 个 整体 的 谓词 。 对 于 形式 动词 跟 其 宾语 ,可 以 把 宾语 一 律 处 理 为 
受 事 ; 当 形 式 动词 直接 带 光 杆 的 动词 作 宾 语 时 ,也 可 以 把 整个 述 宾 结 
构 当 作 一 个 动词 性 成 分 。 

Xiii) 在 “高 强 ……: 遭 到 舆论 批评 ”中 “舆论 ”可 以 分 析 为 是 名 词 
性 成 分 作 方 式 状语 ,类 似 于 “ 熏 论 监督 .电话 联系 ”等 结构 ;于 是 ,可 以 
作出 如 上 例 所 示 的 语义 标注 。 

(iv) 对 于 用 关联 词语 (特别 是 配套 性 关联 词语 ) 引 导 的 复句 ,我 
们 分 别 用 花 括 号 标示 各 分 句 的 界限 ,并 在 括号 后 标明 各 分 句 的 语义 
功能 ,比如 假设 性 条 件 (supposed condition , 简写 为 SUP)3; 结果 
consequence ,简写 为 CSQ) 等 。 还 在 关联 词语 下 面 加 着 重点 。 

Xv) 在 “当时 的 信息 渠道 不 畅通 ”中 ,指示 词 “ 当 时 ?在 土 文中 没 
有 直接 的 参照 词语 ;因为 这 个 指示 词 是 直接 指示 语 境 中 的 张 文 康 任 
卫生 部 长 .非典 疫情 肆虐 而 官方 少 报 疫情 和 隐瞒 疫情 的 那 一 段 时 间 。 
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Cvi) 动词 “透露 ”的 系 事 论 元 省 略 了 ,其 语义 就 是 其 前 面 的 直接 
引 语 。 表 示 强 调 的 “是 ?也 可 以 作为 其 后 的 动词 性 成 分 的 一 部 分 而 加 
着 重点 。 

Cviil“ 为 什么 ”中 的 疑问 代词 “什么 ”的 所 指 是 个 疑问 的 、 不 确定 
的 信息 ,没有 先行 语 可 供 回 指 ;因此 ,不 必 标 注 同 指 关 系 。 在 “他 对 我 
们 的 工作 ……” 中 ,我 们 ? 指 的 是 “我 *, 只 是 由 于 不 能 或 不 便 、 不 宜 用 
个 人 口吻 说 话 ,? 才 用 这 种 复数 性 的 人 称 代词 来 表示 委婉 语气 。 对 
此 ,我 们 用 “我 ?的 同 指 下 标 加 上 问号 来 表示 这 个 代词 的 所 指 涉 及 说 
话 人 ,并 且 可 能 还 包括 其 他 相关 的 人 员 。 

Cviii) 这 篇 报道 内 容 复杂 ,篇 章 组 织 也 相应 复杂 。 全 文 有 八 个 
段落 ,第 一 段 似乎 不 像 是 话题 句 , 但 包含 了 标题 所 透露 的 主题 :高强 
澄清 : 张 文 康 被 撤职 完全 正确 ”。 第 二 段 在 首 句 中 通过 原因 论 元 “ 曾 
经 公开 为 张 文 康 说 好 话 ”, 交 代 高 强 需 要 澄清 的 原因 。 第 三 至 六 段 具 
体 介绍 高 强 说 了 些 什么 和 如 何 为 张 文 康 说 好 话 。 第 七 至 八 段 介绍 其 
他 相关 情况 。 

(7) 标题 : [普京 签署 [命令 jp[ei]A 任免 [ 俄 军 总 参谋 长 

等 强力 部 门 高 官 ]ne 

[中 新 网 ]s{7 月 19 日 }r 电 { 据 俄 通 社 一 塔 斯 社 消息 }w， 
[俄罗斯 总 统 弗 拉 季 米尔 普京 :]A{ 星 期 一 } 签署 [命令 
[ei]s 任免 (了 aa[ 一 系列 俄 强 力 部 门 高 官 ]e。 

[克里姆林 宫 新 闻 处 ]A{19 日 oj 宣布 ,[{ 据 俄 总 统 令 }v， 

[万 里 巴 和 鲁 耶 夫 斯 基 ijjax{ 星 期 五 } 被 Leij]a 任命 为 [ 俄 武 装 力 

量 总 参谋 长 兼 俄国 防 部 第 一 副 部 长 jge,[ 他 ijex 接 替 ! 二 >eed[ 原 

俄 军 参谋 长 安 纳 托 利 。 克 瓦 什 宁 大 将 的 职位 ]Re je。 

[ 克 瓦 什 宁 ]sx{ 自 1997 年 起 }jr 任 [ 俄 军 总 参谋 长 jge。[ 俄 

国防 部 和 总 参谋 部 ]\{ 在 过 去 10 年 中 )r，( 一 直 )uee《( 在 )as 激 烈 

争夺 [军事 行动 和 军队 经 费 党 管 权 ]?。{[ 俄 罗斯 国家 杜 马 (议会 

下 院 )]A{6 月 11 日) 出 台 [一 项 法 律 ]g,[Lek] 授权 [国防 


@ 参考 吕 叔 湘 (1980) 第 489 页 。 
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部 ]oeA 掌 管 [武装 部 队 的 重要 军事 行动 ]w,[ 克 瓦 什 宁 的 总 参谋 
部 ]^ 主要 负 责 规 划 [俄罗斯 未 来 的 军事 进程 ]R}i。 [这 ,]m 就 明 
确 ( 了 )eea[[ 俄 军 大 权 m] 主要 [由 国防 部 ]A 掌管 ,而 (不 ?us{ 是 
[L 总 参谋 部 ]ALV]Leo]p]ne)]ne。 

{ 此 前 。}r[ 俄 (独立 报关 报道 称 ,[[ 克 里 姆 林 宫 。]A 考虑 
[将 6 月 21 一 22 日 发 生 的 武装 分 子 袭击 印 十 什 共 和 国事 件 责 
任 ] 归 咎 于 [ 俄 武装 力 量 总 参谋 长 克 瓦 什 宁 ， 下 cejyg wy[Leo]A 
《并 }App( 可 能 ao 人 (会 ?aol{ 下 达 [ 撤 换 其 。 职务 的 命令 名 })]Re。 
[俄罗斯 国防 部 消息 人 士 ]A 指出 ,{ 因 [ 印 古 什 共和 国 遇 袭 事 
件 ]ea 造 成 [[ 大 量 人 员 。]s, 伤 亡 ]R,[ 其 中 , 大 部 分 ]mm 是 [ 俄 军 和 
其 他 强力 部 门 的 军官 及 工作 人 员 ]e}jm,[ 俄 罗斯 总 统 、 武 装 力量 
最 高 司令 弗 拉 季 米尔 。 普 京 i]A'! 已 经 ?ms 决定 [[ei]A 撤换 [ 克 瓦 
什 宁 ]pmxjge。{ 据 悉 }w,[ 克 瓦 什 宁 r]egx( 已 经 ?pm 被 [ei]A 安排 
到 [一 个 新 的 职位 ]iee) ,他 ,jwgx( 将 ?ae 被 [eg 任命 为 [ 俄 安全 
委员 会 副 秘 书 ]。。 

[分 析 家 js 认为 ,[[[PRO]A 指责 [ 克 瓦 什 宁 ]pees[ 为 印 十 
什 遇 效 事 件 ]& 负 责 ]mw 是 有 [一 定 依据 Ju 的 ]we。[ 俄 罗斯 国家 柱 
马 安全 委员 会 成 员 赤 纳 基 。 库 特 科 夫 ]A 表示 ,[[ 武 装 分 子 ,] 
成 功 地 { 在 印 十 什 共和 国境 内 }i 发 动 (了 ud[ 效 击 破坏 行动 ]， 
{ 并 且 )spp [e.]A 造成 [大量 的 人员]sx 伤 辫 外 ， [颠覆 破坏 活 
动 jr{ 目 前 ) 《已 经 yp 成 为 [ 俄 总 参谋 部 情报 总 局 的 “ 权 
力 ” jg。 jne。 

[现年 57 岁 的 巴 重 那 夫 斯 基 上 将 j]A{ 此 前 ,}5( 曾 us 担任 
[ 俄 军 第 一 副 总 参谋 长 ]ge,[ 他 im 是 [ 俄 美 削 减 战略 进攻 性 武器 
条 约 , 起 草 官 之 一 jg ,[ 这 份 文件 ,]( 已 经 ?se{ 在 ({2002 年 江 
[美国 总 统 布 什 ]A 访 问 [ 英 斯 科 j) 期 间 ) 签署 。 

{ 与 此 同时 \jr,[ 维 切 斯 拉夫 。 基 瞧 米 洛 夫 ]ex 被 [el]A 解 
除 [ 俄 内 务 部 内 卫 部 队 司令 的 职务 ]&,[ 米 哈 依 尔 。 拉 布 涅 
夫 ]e 忆 被 [e]A 解除 [ 俄 内 卫 部 队 北 高 加 索 军 区 司令 的 职务 ]。， 
[ 安 纳 托 利 。 叶 什 科 夫 ]emx 被 [ai]A 解除 [ 俄 联 邦 安全 局 副 局 长 
的 职务 je。 
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{ 据 悉 }wy 人 [ 弗 拉 季 米尔 “布尔 德 列 夫 ]wgx 被 Le] 任命 为 
[ 俄 军 伏尔加 河沿 岸 一 乌拉 尔 军区 司令 ]w,{ 同 时 }jr 被 [e]A 锡 
去 [ 俄 北 高 加 索 军 区 司令 的 职务 je,[ 亚 历 山 大 。 别 罗 
被 Le 和 免 去 [ 俄 北 高 加 索 军 区 紧急 情况 副 司 令 ]jg，,{ 同 

被 [el 任命 为 [俄国 防 部 副 部 长 jge)} 

ee )arew;[ 原 伏尔加 河沿 岸 一 人 
二 巴 拉 诺 夫 ]pgx 被 [el]A 任命 为 [ 俄 北 高 加 索 军 区 司令 je。 

[全 吉 区 力 量 ]m{ 除 正规 军 外 jw if 还 joop 龟 林 [ 过 防 \ 内 务 、 
安全 政府 通讯 、 民 防 和 铁道 部 队 jge。[ 武 装 力量 ]e[ 由 议会 ,总 
统 、 政府 ]A{ (按照 宪法 规定 的 权限 } 共同 指挥 ， [总 统 ]m 是 [起 
装 力量 的 最 高 统帅 ] 污 军 隐 ， 的 任务 ]m 是 [[e， ]A 抵抗 [外 来 侵 
略 ]jp 和 [Le,]A 履行 [ 俄 罗斯 的 国 际 义务 ]w Re; [ 衬 队 人 数 ]m 
《不 ?ug 人 (( 得 》 ui{ 超 过 [全 国人 口 总 数 的 1% js))}; 实 行 [义务 兵 
和 合同 兵 两 种 兵役 制度 jw ,L 服 役 期 限 ]m 分 别 为 [舰队 水 兵 ]m 
[LVJF2 年 ]s ]。 ,其 他 士兵 ]mLVJ]L1 年 半 ]ws,[ 受 过 高 等 教育 
的 ]mLVJL1 年 js 等 ]ge。( 章 田 / 雅 龙 ) 


说 明 : Gi) 指示 词 “ 这 ”的 参照 性 先行 语 为 前 面 的 一 连 串 小 句 。 

《ii) 动词 “指责 ?的 施 事 论 元 是 一 个 隐 售 的 成 分 。 

Xiiil)“ 造 成 大 量 人 员 伤亡 ” 的 省 略 的 主体 性 论 元 , 既 可 以 理解 为 
其 前 名 的 主语 “武装 分 子 ”, 也 可 以 理解 为 整个 前 句 ( 主 谓 结构 多 武装 
分 子 成 功 地 在 印 古 什 共和 国境 内 发 动 了 比 击 破坏 行动 "。 关 于 这 种 
所 指 波 动 的 情况 , 详 见 袁 航 林 (2002c) 。 

iv》 指示 词 " 此 外 ?的 参照 语 是 整个 前 一 段 中 "据悉 ”之 后 的 一 
连 串 句子 。 

Cy) 为 了 一 句 之 中 相关 论 元 在 语义 角色 上 的 协调 和 一 致 ,我们 
把 介词 “ 除 ” 后 面 的 论 元 的 论 旨 角 色 归 和 人 系 事 。 

vi) 关于 同 指 关 系 或 参照 关系 的 下 标 , 可 以 以 全文 ( 整 篇 文章 ) 
为 单位 ,这样 出 现 于 不 同 段 落 中 的 所 指 相 同 的 成 分 可 以 用 相同 的 下 
标 ;但 是 ,这 样 往往 会 使 下 标 编号 过 多 。 也 可 以 以 段落 为 单位 ,但 是 
不 同 段落 中 具有 相同 所 指 的 成 分 无 法 用 相同 的 下 标 编号 ,并 且 涉 及 
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跨 段落 的 回 指 或 参照 关系 就 难以 处 理 了 ， 因 此 ,比较 稳妥 的 办 法 是 
下 标 全 文 依次 统一 编号 。 

Cvii) 这 篇 报道 有 十 个 段落 ,第 一 段 总 提 普 京 任免 一 批 军 官 , 接 
下 来 几 段 分 别 叙述 任免 的 人 物 、 机 构 、 职 务 , 连 带 介绍 被 任命 者 的 生 
平和 被 免职 的 原因 ,非常 符合 任免 类 报道 的 篇 章 结构 的 组 织 惯例 ,最 
后 一 段 介绍 相关 情况 : 俄 军 的 体制 问题 。 文 章 虽 然 比 较 长 ,但 是 章 
法 十 分 清晰 ;并 且 ,用 了 许多 篇 章 关联 词语 或 具有 篇 章 关 联 作用 的 词 
语 来 衔接 句子 和 段落 ,比如 “此 前 、 与 此 同时 、 据 悉 . 此 外 ”, 使 篇 章 结 
构 比 较 紧凑 。 

4 结 语 

通过 对 新 闻 段 落 .简讯 和 全 文 三 种 长 度 的 文本 的 语义 标注 ,我 们 
发 现 它们 在 语义 结构 和 语义 表达 方面 略 有 不 同 ,表现 为 : 新 闻 简 讯 
的 论 元 结构 中 一 般 只 有 主体 性 论 元 和 客体 性 论 元 等 动词 性 成 分 的 必 
有 论 元 , 像 时 间 、 处 所 方式 等 非 必 有 论 元 通常 不 出 现 。 新 闻 段 落 由 
于 不 是 全 文 , 因 而 其 中 有 关 的 代词 和 指示 性 词语 的 先行 语 和 参照 语 
不 一 定 在 本 段落 中 出 现 , 也 就 是 说 代词 和 指示 词 的 回 指 和 参照 关系 
可 能 是 跨 段 落 的 。 即 使 在 全 文中 , 仍 可 能 存在 指示 情景 的 代词 和 指 
示 词 ,它们 并 没有 明确 的 参照 性 词语 ,而 是 指示 由 上 文 所 叙述 或 暗示 
的 某 种 情景 的 。 也 就 是 说 ,这 种 代词 和 指示 词 的 先行 语 没有 用 显 性 
的 词汇 形式 来 实现 ,其 语义 是 隐 含 在 上 下 文 语 境 中 的 。 对 此 ,语义 标 
注 时 无 法 作出 标记 ,给 机 器 的 自动 处 理 带 来 了 难以 解决 的 困难 。 

另外 ,我 们 发 现 : 在 新 闻 文 本 中 ,句子 之 间 的 衔接 ,词汇 和 结构 
等 表层 形式 手段 相对 丰富 ,也 便于 作出 形式 化 的 表示 和 标注 ;而 段落 
之 间 的 衔接 ,词汇 和 结构 等 表层 形式 手段 相对 贫乏 ,也 难于 作出 形式 
化 的 表示 和 标注 。 
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四 、 专 题 研究 和 
个 案 分 析 


te 
Www 


及 相关 的 语法 现象 


词语 同 现 限制 的 认 知 解释 和 计算 分 析 


本 文 以 “ 满 ?>“ 全 ?等 词语 在 用 法 和 意义 上 的 差别 为 例 , 说 明 怎样 从 隐 
喻 的 角度 分 析 语言 表达 中 词语 的 同 现 限制 问题 ,建议 把 隐喻 分 析 提升 到 
意象 图 式 的 抽象 水 平 , 藉 此 把 语言 的 认 知 解释 转换 成 算法 规则 和 形式 表 
示 , 从 而 实现 认 知 和 计算 的 统一 。 文 章 分 为 八 个 部 分 : 8 1 讨论 “ 满 十 NP>” 
和 ”全 十 NP? 在 形式 和 意义 上 的 不 平行 性 ,8 2 用 容器 隐喻 来 分 析 跟 “ 满 ? 
相关 的 表达 ,用 套件 隐喻 来 分 析 跟 “全 ”相关 的 表达 ;83 用 意象 图 式 的 概 
念 来 讨论 不 同 的 容器 隐喻 表达 的 心理 表征 问题 , 8 4 用 容器 隐喻 和 套件 隐 
喻 的 中 和 来 解释 “ 满 ?“ 全 ” 跟 “ 一 ”的 交替 关系 485 用 配偶 图 式 和 平分 图 
式 的 对 立 , 来 解释 古代 汉语 中 “ 双 ” 和 “两 > 在 意义 和 用 法 上 的 差别 ; 86 讨 
论 隐 喻 和 意象 图 式 的 跨 平面 性 (词法 一 句法 )、 超 范畴 性 (形容 词 一 动词 一 
副词 ) 和 超 语言 性 (汉语 一 英语 )，8 7 讨论 怎 料 从 隐喻 表达 的 图 式 解剖 走 
向 其 语义 的 形式 表示 和 计算 分 析 , 88 举例 说 明 认 姑 解释 的 概括 性 。 


1 “ 满 十 NP” 和 “全 十 NP" 在 形式 和 
意义 上 的 不 平行 性 


形容 词 满 ?和 ”全 ”都 可 以 修饰 名 词 ,表示 某 种 东西 遍及 名 词 所 
指 的 事物 。 值 得 注意 的 是 ,在 这 种 由 形容 词 修饰 名 词 构成 的 偏 正 结 
构 中 ,它们 有 时 可 以 互相 替换 ,有 时 却 不 能 互相 蔡 换 。 例 如 : 

CD 满 身 是 计 一 全 身 是 江 
清 商 场 的 人 一 全 商场 的 人 
(2) 满 脸 是 汗 ~ x 全 脸 是 汗 
“请 全 司 的 人 一 全 公司 的 人 
《3) 满 场 寂静 中 ,舞台 灯光 忽然 聚集 在 她 身上 。 不 等 她 开 
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口 ,全 场 已 是 掌声 雷动 ,经 久 不 息 。( 储 引 ,339) 


既然 在 这 种 偏 正 结构 中 存在 着 "“ 满 2 和 “全 ”不 能 替换 的 情况 ,那么 
说 明 “ 满 2 和 “全 ”在 意义 上 有 一 定 的 差别 ,并 由 此 造成 < 满 十 NP” 和 
“全 十 NP” 在 意义 上 也 有 相当 的 差别 。 对 此 ，, 储 泽 祥 (1996) 作 了 详 
细 的 考察 ,得 出 结论 :“ 满 十 NP” 和 “全 十 NP” 既 能 表示 范围 .也 能 表 
示 数 量 。 但 是 “ 满 十 NP” 极 言 某 范围 的 事物 的 数量 , 重 在 数量 , 表 
示范 围 是 附带 性 的 ;全 十 NP? 直 接 总 括 事物 的 范围 , 重 在 范围 。 
例如 : 


(4) 这 满 屋子 的 书 才 是 真正 的 财富 呀 ,一 莫 子 都 受用 不 尽 
的 。( 储 引 ,339) 

(5) 全 公司 只 有 我 一 个 人 可 以 在 工作 时 间 看 报 。( 储 引 ， 
339) 


他 解释 道 : 在 例 (4) 中 ,* 满 屋子 ?首先 是 表明 "“ 书 ”的 数量 ,由 “ 书 ” 所 
占据 的 空间 再 来 表示 “屋子 ”的 范围 。 在 “ 满 十 N 十 的 十 X? 中 ， 满 十 
N” 需 要 借助 X 来 表示 范围 ,因此 (表示 范围 ) 是 间接 性 的 .附带 的 。 
在 例 (5) 中 ,全 ”不 需要 借助 别 的 成 分 , 直接 确定 “公司 ”的 范围 (第 
339 页 ) 。 

储 泽 祥 (1996) 的 这 种 说 明 ,不 仅 跟 我 们 的 感觉 几乎 相反 ,而 且 不 
易 说 明 例 (2) 中 * 满 十 NP” 和 “全 十 NP” 在 用 法 上 的 不 平行 性 。 比 如 ， 
既然 “全 十 NP? 重 在 表示 范围 ,那么 为 什么 “全 脸 是 汗 ? 这 种 说 法 是 不 
合格 的 ;既然 “ 满 上 N” 重 在 表示 数量 ,那么 为 什么 “ 满 公 司 的 人 ”这 
种 说 法 是 不 合格 的 。 如 果 这 两 种 格式 在 表示 范围 和 数量 上 的 确 有 所 
偏重 的 话 ,那么 我 们 毋 宁 说 :“ 满 二 NP”? 是 重 在 表示 范围 的 ,而 “全 十 
NP” 是 重 在 表示 数量 的 。 因 此 , 当 要 强调 整个 脸 部 这 个 范围 内 都 有 
汗 时 ,可 以 说 “ 满 脸 是 汗 ”; 而 遍及 脸 部 的 汗 是 无 法 (或 不 易 ) 用 数量 来 
度量 的 ,因此 不 能 说 “全 脸 是 汗 ”。 当 要 强调 整个 公司 的 人 员 数 量 时 ， 
可 以 说 “全 公司 的 人 ”; 而 公司 作为 一 种 非 处 所 性 的 机 构建 制 ,不 便 用 
实在 的 范围 来 指 陈 , 因 此 不 能 说 “ 满 公 司 的 人 ”。 当 然 , 这 种 解释 也 不 


@O “ 储 引 ,339? 指 转 引 自 储 泽 祥 (1996) 的 有 出 处 的 例句 ,下 仿 此 。 
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是 最 为 妥 帖 的 , 跟 事实 还 是 隔 了 一 层 。 
比较 下 列 “ 满 十 NP” 和 "全 十 NP” 格 式 在 意义 上 的 差别 是 十 分 有 
趣 的 。 例 如 : 


《7) 满 场 喝采 玉 全 场 喝采 满 场 的 观众 之 全 场 的 观众 
(8) 满 楼 的 人 天 全 楼 的 人 满 车 厢 旅 客 天 全 车 厢 旅 客 
满 世 界 天 全 世界 
(9) a. 凡是 在 您 手下 工作 过 的 同志 , 调 走 后 都 满 世界 宣传 
您 的 事迹 。( 电 子 语 料 ) 
b.、* …… 调 走 后 都 全 世界 宣传 您 的 事迹 。 
(10) a， 要 说 全 世界 各 民族 让 我 挑 , 我 还 挑 中 华 民族 。( 电 
。 ， 子 语 料 ) 
b，x 要 说 满 世界 各 民族 让 我 挑 …… 


从 意义 上 看 ， 满 场 喝采 ?” 跟 * 全 场 喝采 ?差别 不 大 ;但 是 ,“ 满 楼 的 人 ” 
跟 * 全 楼 的 人 ”的 差别 就 比较 明显 : 前 者 指 当 时 在 楼 里 的 全 部 人 员 
(不 管 是 住户 还 是 临时 在 那儿 的 ), 后 者 则 指 常住 在 楼 里 的 全 体 人 
员 。9 不 仅 “ 满 世界 ? 跟 * 全 世界 ”的 意义 不 同 : 前 者 指 遍 及 某 个 言谈 
论 域 C(universe of discourse) 中 的 各 处 ,后 者 指 遍 及 整个 地 球 上 的 所 
有 地 方 。 而 且 , 这 两 个 格式 中 “世界 ”的 意义 也 不 相同 : 前 者 指 言谈 
中 的 某 个 地 方 , 是 口语 中 一 种 引申 性 的 意义 和 用 法 ;后 者 指 地 球 上 的 
所 有 地 方 , 是 书面 上 一 种 基本 的 意义 和 用 法 ;并 且 , 从 所 指 范围 上 看 ， 
前 者 明显 小 于 后 者 。.@ 更 耐人寻味 的 是 ,引申 义 的 “世界 ”只 能 跟 
“ 满 ? 组 合 , 不 能 跟 * 全 ?组 合 ,基本 义 的 “世界 ”只 能 跟 * 全 ”组 合 、 不 能 跟 
“ 满 ? 组 合 。 凡 此 种 种 ,都 激发 我 们 在 “ 满 十 NP? 和 “全 十 NP” 的 形式 和 
意义 的 不 平行 性 背后 ,去 寻找 更 具 概括 性 的 分 析 概 念 和 理论 解释 。 


@ 参考 储 泽 祥 (1996: 343) 8 4. 2 中 的 有 关 说明 。 

@ 储 泽 祥 (1996: 340) 以 “ 满 世 界 ? 为 例 , 说 有 些 抽 象 名 词 跟 * 满 ”结合 后 范围 会 被 缩 
小 。 也 就 是 说 ,他 认为 这 只 是 词义 的 临时 变化 。 我 们 认为 也 不 排除 这 种 可 能 :“ 世 界 ”* 有 地 
方 . 某 处 的 意思 。 可 资 参照 的 是 ,在 吴语 中 尚 有 这 种 意义 和 用 法 的 遗存 。 例 如 : 

该 个 物事 占 世 界 ”这 个 东西 占 地 儿 
拿 纸 头 屑 粒 弄 得 一 天 世界 ”把 纸 属 弄 得 到 处 都 有 
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2 容 回 隐喻 " 满 ” 和 套件 隐喻 全” 


事实 上 ,根据 我 们 的 语感 ,似乎 应 该 有 比 “ 范 围 ”? 和 "数量 ?更 好 的 
分 析 概 念 和 理论 模型 ,来 解释 “ 满 十 NP” 和 "全 十 NP? 在 形式 和 意义 
上 的 不 平行 性 。 例 如 :下面 的 a 例 均 来 自 电 子 语 料 ) 


(1) a。 人 家 师傅 这 已 经 是 满 肚子 不 高 兴 了 ，…… 
b. #* 人 家 师傅 这 已 经 是 全 肚子 不 高 兴 了 ，…… 

(2) a. 我 也 是 打 那 时 候 过 来 的 ， 满 脑子 英雄 壮举 。 
bx 我 也 是 打 那 时 候 过 来 的 ,全 脑子 英雄 壮举 。 

(3) a。 白 度 和 孙 过 仁 心疼 地 望 着 元 豹 , 满 桌 菜肴 几乎 一 口 
没 舍得 吃 全 尽 着 元 鹏 了 。 
b. 关 seeses 全 课 菜 肴 几乎 一 口 没 舍得 吃 es see 

(4) a.， 一 九 七 九 年 在 某 美术 出 版 社 当 管 子 工期 间 , 曾 满 大 
街 地 纠缠 女 青 年 , 找 模特 儿 。 
b。 关 。e。。 曾 全 大 街 地 纠缠 女 青年 ER 了 7 

《5) a. 这 是 全 北京 家 最 僻静 的 地 方 ， 坏人 作案 都 不 上 这 角 
沫 5 
b. x 这 是 满 北 京 最 僻静 的 地 方 ，…… 

(6) a 既然 是 全 民族 的 事 就 该 全 民族 出 血 ,你 不 能 光 指 着 
我 们 几 个 派 菩 派 捐 。 
b. 关 既然 是 满 民族 的 事 就 该 满 民 族 出 血 …… 

(7) a. 我 要 大 声 疾 呼 ， 让 全 社会 都 来 关心 你 们 。 
b.x 我 要 大 声 疾 呼 ,让 满 社会 都 来 关心 你 们 。 

《8) a. 全 单位 的 人 都 觉 察 到 阮 琳 身上 将 要 发 生 什么 
思议 的 奇 变 。 
b. #* 满 单 位 的 人 都 觉察 到 阮 琳 身上 将 要 发 生 什么 不 
可 思议 的 奇 变 。 

9) a. 一 个 一 直 坐 在 一 边 就 餐 看 了 全 过 程 的 汉子 对 女友 
说 :“ 今 儿 算是 见 着 真 流 误 了 。? 
bx* 一 个 一 直 坐 在 一 边 就 餐 看 了 满 过 程 的 汉子 对 女 
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为 什么 “ 满 肚 子 . 满 脑子 ` 满 桌 、 满 大 街 > 和 “全 北京 .全 民族 、 全 社会 、 
全 单位 .全 过 程 ? 是 合格 的 表达 ,而 相应 的 “全 肚子 .全 脑子 .全 桌 、 全 
大 街 ” 和 " 满 北京 `. 满 民族 、 满 社会 、 满 单位 ` 满 过 程 ? 是 不 合格 的 表达 。 
这 显然 是 没 法 用 “范围 >? 和 “数量 ”之 类 的 概念 来 加 以 解释 的 。 

在 分 析 诸 如 此 类 的 语言 现象 的 过 程 中 ,我 们 逐渐 体会 到 : 跟 
“ 满 ” 相 关 的 语言 表达 是 以 容器 隐喻 (container metaphor) 为 基础 的 。 
比如 ,人 们 把 肚子 看 作 是 一 种 承受 喜 怒 哀乐 .学 问 、 心 思 等 的 容器 ,于 
是 便 有 了 " 满 肚子 的 高 兴 、 怒 气 、 委 届 、 学 问 、 和 点 子 ” 等 表达 方式 ;人 
们 把 桌子 看 作 是 承载 饭碗 、 菜 盘 的 容器 ,于 是 便 有 了 *“ 满 桌 的 饭菜 、 佳 
看 酒水 ?等 表达 方式 ;人 们 把 大 街 看 作 是 一 种 承载 行人 的 容器 ,于 是 
便 有 了 " 满 大 街 的 行人 、 商 贩 、 特 务 . 小 偷 、. 骗 子 ” 等 表达 方式 。 而 北 
京 、. 民 族 、 社 会 .单位 ,过程 等 稍微 抽象 一 点 儿 的 概念 ,人 们 不 一 定 把 
它们 (或 它们 本 身 不 便 被 ) 看 作 是 容器 ,因此 没有 “ 满 北京 . 满 民 族 : 满 
社会 满 单位 、` 满 过 程 一 类 表达 方式 。 跟 * 全 ”相关 的 语言 表达 是 以 
套件 隐喻 (suite metaphor) 为 基础 的 ,比如 : 人 们 把 北京 看 作 一 个 由 
东城 西城 宣武 .朝阳 海淀 丰台、 延庆 、 平 谷 ` 怀 柔 等 区 县 (类 似 一 
组 部 件 ) 构 成 的 一 个 行政 单位 (类 似 一 个 套件 ) 于 是 便 有 了 “全 北京 
的 工厂 ,学校 .医院 .商店 ”一 类 表达 方式 ;大 们 把 民族 、 社 会 .单位 看 
成 是 由 更 小 的 单位 构成 的 套件 ,于 是 便 有 了 “全 民族 的 力量 、 全 社会 
的 积极 性 、 全 单位 的 职工 ”等 表达 方式 。 人 们 把 事物 运动 的 过 程 看 作 
是 由 开始 发展、 结束 等 步骤 构成 的 ,于 是 便 有 了 “生长 发 育 / 生 命 形 
成 /宇宙 创 生 / 独 立 建 国 /制作 动画 片 /解决 问题 的 全 过 程 > 等 表达 方 
式 。 而 肚子 脑子、 桌子. 大街 等 事物 ,人 们 不 一 定 把 它们 (或 它们 本 
身 不 便 被 ) 看 作 是 套件 ,因此 没有 “全 肚子 、 全 脑子 、 全 桌 ` 全 大 街 ” 一 
类 表达 方式 。 这 就 在 一 定 程 度 上 印证 了 Haiman(1985) 和 Geeraers 
《1990) 等 认 知 语言 学 著作 关于 意义 的 一 个 基本 的 观念 : 语义 不 是 基 
于 客观 的 真 值 条 件 ,语义 结构 也 不 能 简单 地 化 解 为 真 值 条 件 的 配 列 ， 
它 并 非 对 应 于 客观 的 外 在 世界 ,而 是 对 应 于 非 客观 的 投射 世界 (pro- 
jected world) ,并 与 其 中 约定 俗 成 的 概念 结构 (conceptual structure) 
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直接 关联 .9 

利用 容器 隐喻 、 套 件 隐喻 等 分 析 概 念 ,》 1 中 "“ 满 十 NEP "和 “全 十 
NP” 的 不 平行 性 就 可 以 得 到 充分 的 解释 。 比 如 ,在 人 们 的 观念 中 ， 
“人 ”中 “公司 ”这 种 抽象 的 机 构 难 以 形成 容 物 (content) 跟 容器 的 关 
系 ; 因 此 ,“ 满 公司 ”这 种 表达 方式 是 不 可 接受 的 。 在 人 们 的 观念 中 ， 
“ 脸 ” 这 种 人 体 部 件 一 般 不 再 分 解 为 几 个 更 小 的 部 件 , 即 它 不 是 套件 ; 
因此 ,* 全 脸 ” 这 种 表达 方式 是 不 可 接受 的 。 同 样 , 在 人 们 的 观念 中 ， 
商场 既 可 以 看 作 是 一 种 承载 着 店员 、 顾 客 这 两 种 人 员 的 容器 ,又 可 以 
看 作 是 一 种 由 店员 、 顾 客 双方 构成 的 套件 ;因此 ， 满 商场 (的 人 )、 全 
商场 (的 人 )? 都 是 可 以 接受 的 。 据 此 ,为 什么 在 意义 上 满 场 喝采 后 
全 场 喝采 ` 满 场 的 观众 莹 全 场 的 观众 ”, 也 可 以 作出 合理 的 解释 : 剧 
场 等 既 可 以 从 整体 上 看 作 是 承载 观众 的 容器 ,又 可 以 从 构成 上 看 作 
是 由 一 定数 量 的 座位 组 成 的 套件 。 在 这 种 情况 下 ,具体 用 满 ” 还 是 
“全 ”全 凭 说话 人 更 想 突 出 剧场 的 容器 性 质 还 是 突出 剧场 的 套件 性 
质 。 至 于 “ 满 世 界 ” 中 的 “世界 ?为 什么 上 只 能 是 语义 范围 较 小 的 引申 
义 : 而 不 能 是 语义 范围 较 大 的 基本 义 ,这 似乎 可 以 从 现实 世界 知识 
(world knowledge) 对 语言 表达 的 制约 上 作出 解释 : 较 小 的 空间 更 
容易 形成 容器 隐喻 ,充满 这 个 较 小 空间 具有 较 大 的 现实 可 能 性 ; 较 大 
的 空间 不 容易 形成 容器 隐喻 ,充满 这 个 较 大 空间 具有 较 小 的 现实 可 
能 性 。 比 如 ,就 “ 满 世 界 宣传 / 乱 跑 /都 是 商人 ?等 表达 而 言 , 引 申 义 的 
“世界 ? 比 基 本 义 的 “世界 ”更 可 能 实现 ,也 更 容易 被 人 们 理解 和 接受 。 

值得 注意 的 是 ,有 时 候 单独 的 “ 满 十 NP? 或 “全 十 NP” 是 合格 的 ， 
但 是 当 这 两 种 形式 后 面 加 上 相同 的 中 心 语 .从 而 形成 满 /全 十 NP 十 
(的 )X2? 格 式 时 , 却 只 有 其 中 的 一 种 格式 是 合格 的 。 例 如 :《〈 下 面 的 a 
例 均 来 自 电子 语 料 ) 


(10) a。 一 个 穿 长 衣 的 小 猴 打 着 锣 ,脖子 上 失 着 绳 满 场 转 
转 。 
b.? 一 个 穿 长 衣 的 小 猴 打 着 锣 , 脖 子 上 失 着 绳 全 场 


@ 详 见 张 敏 (1998) ,第 5 一 6 页 ;前 言 , 第 1 页 。 
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转圈 。 
(11) a。 他 ……。 又 满 身 上 下 摸 多 ， 0 本 


《12) a， 丁 小 鲁 几乎 全 身 裸露 在 十 路 "…。 
b.* 丁 小 鲁 几 乎 满 身 裸露 在 雨中 心心 。 
13) a， 高 烧 不 退 , 很 快 出 现 了 中 毒性 休克 ,全 身 各 系统 随 
之 接连 崩溃 。 
b、* …… 满 身 各 系统 随 之 接连 崩溃 。 
对 此 ,一 种 可 能 的 解释 是 : 更 能 跟 * 转 圈 、 摸 忽 " 这 种 行为 相配 合 的 是 
空间 性 的 容器 ,更 能 跟 * 裸 露骨 省 ”这 种 行为 相配 合 的 是 “部 分 一 整 
体 " 性 的 套件 。 


3 从 隐喻 分 析 走 向 意象 图 式 分 析 


如 果 仔 细 追 究 ,那么 我 们 一 定 会 发 现 : 在 包含 “ 满 ”( 即 以 容器 隐 
喻 为 基础 ) 的 语言 表达 中 ,容器 在 空间 结构 上 具有 拓扑 可 变性 (立体 、 
平面 等 )。 例 如 : ( 均 来 自 电子 语 料 ) 


人 二 
b. 
〈2) a. 
bi 
灰尘 
《3) a. ee 和 


sy 


b. 到 时 候 我 们 也 为 你 们 说 好 话 , 不 搞 满 癌 抄 斩 。 
(6) a， 我 …… 怎 么 一 见 这 孩子 就 满 事 高 兴 ? 
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b、…… 病 国 充 满 了 忧伤 。 
c. 小 姑娘 望 着 分 板 ,[ 丙 
d. 我 们 是 很 残忍 的 ,车 硬 ] 充 满 了 杀机 。 
(7) a. 袜 字 很 俏皮 ,[ 实 党 里 面 ] 充 满 了 英国 式 的 机 智 。 
. b. 一 直 没 出 声 的 冯小刚 远 远 地 开口 ,语调 浑厚 ， 
[请 漂 遇 充满 深情 。 
c. 要 扳 起 一 个 学 元 豹 赶 元 鹏 的 热潮 ,让 生活 充满 阳 


D 充 满 和 起 地 说 。 


光 而 刘 机 二 是 

d. 上 个 月 底 , [第 芍 ] 刚 满 十 八 岁 。 

e. 我 们 会 把 这 一 天 的 间 程 给 您 排 得 满 满 的 。 

大千 世 界 , 无 奇 不 有 ,清洁 工 淘 类 工 [ 名 阁 ] 都 招 不 
满 ， 曾 吉 琶 硬 届 生 


例 C1) 中 的 “ 池 里 大厅 里 ”是 比较 典型 的 下 四 的 .三维 立体 容器 , 例 
(2) 中 的 “地 上 、 办 公 桌 上 ”是 不 太 典 型 的 二 维 平 面容 器 , 例 (3) 中 的 
“ 头 ` 山 上 ” 则 是 不 太 典 型 的 \ 向 上 凸 起 的 、 介 于 二 维和 三 维 之 间 的 容 
器 , 例 (4) 中 的 “ 树 、 枝 ?是 不 典型 的 、 准 圆柱 面容 器 ; 例 (5) 中 的 “视野 、 
门 (家 族 )” 则 是 一 种 抽象 性 的 .更 具 隐 喻 性 质 的 容器 , 例 (6)(7) 方 括 
号 中 的 成 分 是 我 们 添加 进去 的 ,其 中 (内 ) 心 ,心里 \ 文 字 ( 里 面 )、 语 
调 ( 中 )、 生 活 、 年 龄 日程、 名额 ”等 显然 是 更 加 抽象 的 ` 饱 含 隐喻 色彩 
的 容器 。 

上 述 容器 从 立体 到 平面 .从 下 凹 到 上 凸 、 从 具体 到 抽象 .从 比较 
写实 的 到 非常 隐喻 性 的 ,变化 万 端 。 那 么 ,从 心理 学 的 观点 出 发 ,我 
们 就 得 提出 如 下 三 个 问题 : (GD 人 们 在 语言 交际 中 使 用 诸如 例 (1) 一 
(7) 这 类 容器 隐喻 时 ,他 们 在 心理 上 到 底 有 什么 样 的 表征 (psycho- 
logical reptresentation)? 《ii) 他 们 的 心理 上 是 否 真 的 显现 出 一 个 容 
器 的 形象 来 呢 ? 如 果 是 这 样 ,那么 这 个 容器 是 什么 样 的 (比如 : 下 四 
的 还 是 上 凸 的 .三维 的 还 是 二 维 的 )? 〈iii) 这 种 容器 是 固定 不 变 的 ， 
还 是 会 随 着 不 同 的 语言 表达 而 发 生变 化 的 (比如 : 在 例 1 这 类 表达 
中 是 下 目 的、 但 在 例 3 这 类 表达 中 是 上 吓 的 )? 如 果 是 随 着 句子 而 变 
化 的 ,那么 ,在 例 7 这 类 表达 中 该 是 什么 样 的 呢 ? 对 此 ,我 们 信 从 
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Johnson(1987) 和 Lakoff(1987) 等 认 知 语言 学 家 的 见解 :0 这 些 隐喻 
的 心理 基础 和 表征 不 是 具体 的 视觉 形象 ,而 是 抽象 的 意象 (image or 
imagery) 和 意象 图 式 (image scheme); 比 如 ,容器 隐喻 之 下 是 一 个 基 
于 “里 一 外 ”关系 的 抽象 的 容器 图 式 (container scheme)。 根 据 Un- 
gerer & Schimid(1996) ,意象 图 式 是 “来 源 于 我 们 在 日 常生 活 中 与 
世界 的 互动 经 验 的 简单 而 基本 的 认 知 结构 "”。Johnson(1987) 说 得 更 
具体 ,他 认为 : 为 使 我 们 能 具备 有 意义 的 .相互 联系 的 经 验 , 并 能 理 
解 它们 及 对 之 进行 推理 ,我 们 的 行为 .感觉 .知觉 活动 中 一 定 存在 着 
模式 和 常规 。 意 象 图 式 正 是 上 述 活 动 中 一 再 出 现 的 模式 .形状 和 规 
律 。 意 象 图 式 具 有 下 列 三 个 特点 : (1) 抽象 性 , 它 比 心理 学 家 所 说 
的 心 象 (mental imagery) 更 加 一 般 和 抽象 ? 跟 环 境 无 关 ; 而 后 者 则 是 
一 种 跟 环 境 相关 的 较 具 体 的 意象 , 比如 看 了 一 个 正 写 的 R 后 在 大 脑 
中 形成 不 同 角 度 翻 转 的 知觉 表征 。(2) 独立 性 , 它 可 以 超越 任何 特 
定 的 感知 方式 而 独立 存在 ; 它 主要 附 丽 在 感觉 运动 (sensorimotor) 
的 层面 ,与 我 们 对 空间 位 置 . 运 动 ,形状 的 感受 相关 ; 它 可 以 同时 是 视 
党 的 .听觉 的 、 动 党 的 和 触觉 的 ,是 一 种 空间 关系 和 空间 位 移 的 动态 
类 比 表征 (dynamic analog representation) 。(3) 完 形 性 ,意象 图 式 
尽管 由 可 辨识 的 部 分 和 关系 组 成 , 却 具 有 完 形 的 特性 (gestalt) ;是 二 
个 内 部 一 致 的 .有 意义 的 统一 体 。 它 是 我 们 获得 意义 结构 的 主要 方 
式 。 有 了 这 些 理论 上 的 支持 ,我 们 可 以 回答 本 段 一 开始 提出 的 三 个 
问题 了 。 原 来 ,在 容器 图 式 这 种 抽象 的 认 知 模式 的 指导 下 ,外 部 世界 
中 被 我 们 视 为 容器 的 不 光 包 括 池 子 、 大厅 之 类 有 自然 边界 的 三 维 实 
体 , 还 包括 被 我 们 感知 出 边界 的 地 上 、 树 上 等 实体 ;总 之 ,凡是 有 边界 
或 能 构想 出 边界 的 物理 空间 都 是 容器 。 进 二 步 将 这 一 容器 概念 映射 
mapping) 到 更 为 抽象 的 领域 ,就 形成 了 各 种 容器 隐喻 。 比 如 ,视野 
被 概念 化 为 容器 ,我们 的 视线 界定 了 视野 的 边界 , 它 就 成 为 了 容器 ; 
心理 (或 心灵 ?被 概念 化 为 容器 ,各 种 思想 .情感 便 是 感 在 这 个 容器 中 
的 内 容 或 容 物 。 不 管 哪 一 种 容器 , 它 一 定 具 有 容器 图 式 的 基本 结构 : 


@ ”下 述 关于 意象 图 式 和 容器 边界 等 的 说 明 , 详 见 张 敏 (1998), 第 9 一 102 页 ;第 


"” 103 一 121 页 。 
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有 一 个 边界 , 它 把 相关 的 空间 划分 为 内 部 和 外 部 两 个 部 分 ,从 而 在 人 
的 心理 上 形成 一 个 容器 的 构 型 (configuration) 。 这 种 构 型 具有 相当 
的 实在 性 ,所 示 是 意象 性 的 ;同时 ,这 种 构 型 又 是 相当 抽象 的 ,适应 于 
不 同 的 在 空间 上 具有 拓扑 可 变性 的 事物 (包括 具体 的 .物质 的 和 抽象 
的 、 精 神 的 ) ,所 以 是 图 式 性 的 。 根 据 Anderson(1990: 133), 图 式 是 
一 种 从 特定 事例 (specific instance) 到 关于 范畴 等 概括 表达 的 抽象 ， 
图 式 表 达 (sehema representation) 可 以 反映 事物 的 特征 构 型 。 因 此 ， 
把 容器 隐喻 分 析 抽 象 为 意象 图 式 分 析 具 有 充分 的 认 知 心理 学 上 的 根 
据 。 


4 浑然 图 式 " 一 ”: 容器 隐喻 和 
套件 隐喻 的 中 和 


上 文 从 容器 隐喻 表达 中 容器 在 空间 结构 方面 的 可 变性 上 ,引出 
结论 : 容器 隐喻 分 析 必 须 上 升 到 更 为 抽象 的 意象 图 式 水 平 , 才 能 更 
有 解释 力 。 这 种 意象 图 式 概念 ,对 于 分 析 套件 隐喻 表达 就 显得 更 为 
迫切。 比如 ,人 们 在 使 用 “全 身 、 全 场 . 全 车 厢 、 全 单位 .全 北京 、 全 中 
国 、 全 民族 、 全 世界 、 全 社会 .全 过 程 ?等 套件 隐喻 表达 式 时 ,不 可 能 真 
的 在 心理 上 形成 如 下 形象 : 由 躯体 .四 肢 和 脑袋 等 构成 的 人 体 套 件 ， 
由 一 排 排 座位 构成 的 剧场 或 车 啉 套件, 由 一 个 个 具体 部 门 构成 的 社 
会 套件 ,由 事物 发 展 的 一 个 个 阶段 构成 的 进程 套件 ;而 只 能 是 更 具 概 
括 性 的 意象 图 式 , 这 种 套件 图 式 由 一 个 整体 和 若干 个 部 分 、 一 个 体现 
各 部 分 如 何 构成 整体 的 构 型 组 成 比如 ,对 于 人 体 套 件 来 说 ,这 种 
构 型 就 是 典型 的 人 体外 观 : 包含 五 官 的 头 在 上 、 四 肢 在 人 体 对 称 的 
两 侧 ,总 之 各 部 分 之 间 在 物理 上 是 相连 接 的 ;对 于 社会 这 种 套件 来 
说 ,这 种 构 型 就 是 一 种 层级 关系 (hierarchical relation) : 较 小 的 单位 
逐 层 构成 较 大 的 单位 , 嘿 现 出 一 种 金字 塔 形 ,总 之 各 部 分 是 按照 一 种 
抽象 的 关系 而 联结 成 整体 的 。 


@ 下 述 关于 意象 图 式 和 容器 边界 等 的 说 明 , 详 见 张 敏 (1998) ,第 90 一 102 页 ;第 
103 一 121 页 。 
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有 了 意象 图 式 这 种 抽象 的 概念 ,就 可 以 说 明 在 实际 的 语言 使 用 
中 容器 隐喻 和 套件 隐喻 中 和 化 Cneutralization) 的 现象 。 例 如 : 


(1) 满 身 是 血 ~ 全 身 是 血 ~ 一 身 是 血 ~ 浑身 是 血 

2) 满 身 的 汗 ~ 全 身 的 汗 ~ 一 身 的 汗 一 浑身 的 汗 

(3) 满 车 厅 人 一 全 车 厅 人 一 一 车 厅 人 ~ 整 车 厅 人 

《4) 一 着 不 愤 ， 全 / 满 盘 给 一 ? 一 盘 尼 输 

《5) 满腔 热 心 一 一 腔 热 ， 心 满腔 热忱 ~ 一 腔 热 忱 
满腔 怒火 一 腔 起火 

〈6) 全 心 全 意 一 一 心 一 意 


从 上 述 例子 可 以 看 出 , 当 容器 隐喻 和 套件 隐喻 都 突出 整体 性 、. 忽 略 构 
成 上 的 细节 ，, 即 不 追究 到 底 是 有 边界 的 构 型 .还 是 有 "部 分 一 整体 ?这 
种 构 型 时 ;可 以 用 "一 ”来 代替 “ 满 ”? 和 "全 ”, 于 是 ,原来 有 一 定 的 对 立 
性 的 容器 隐喻 和 套件 隐喻 便 中 和 化 为 更 为 抽象 的 浑然 图 式 。 至 于 例 
(4) 中 的 “ 满 /全 盘 缘 输 ” 不 能 说 成 “一 盘 缘 输 ”, 主 要 的 原因 是 为 了 跟 
前 面 的 “一 着 不 慎 ? 中 的 “一 ”避免 重复 。 这 种 用 “一 ”代替 “ 满 ` 全 ”的 
浑然 意象 图 式 表达 ,在 真实 文本 中 也 是 极为 常见 的 。 例 如 :〈 下 面 的 
a 例 均 采 自 电子 语 料 ) 


《7) a. 一 屋 人 开怀 大 笑 , 连 于 观 、 杨 重 也 忍 不 住 笑 了 。 
b。 满 /全 屋 人 开怀 大 笑 ， 
(8) a. 看 完稿 子 已 是 一 身 大 汗 ，… 
b. 看 完稿 子 已 是 满 /全 身 大 汗 ，…: 
(9) a， 少 妇 一 抬 手 把 桌 上 的 杯子 扫 到 地 上 ,接着 把 一 托盘 
茶杯 挨个 摔 在 地 上 。 
es 接着 把 满 /? 全 托 副 茶杯 挨个 摔 在 地 上 。 
《10) a. 审讯 的 和 被 审讯 的 脸 都 绿 了 ,一 脸 不 耐 闫 。 
b. 审讯 的 和 被 审讯 的 脸 都 绿 了 , 满 脸 不 耐烦 。 
(11) a.， 只 见 刘 明 顺 一 头 大 汗 地 走 在 人 群 前 边 ，…… 
b， 只 见 刘 明 顺 满 头 大 汗 地 走 在 人 群 前 边 ，…… 
《12) a. 一 个 一 身 素 白 , 和 白衣 和 白 鞋 白头 发 的 小 脚 乡下 老 太 
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b. 一 个 全 身 素 白 , 白 家 和 白 鞋 白头 发 的 小 脚 乡下 老 太 


《13) 谊 月 还 想 说 点 什么 ,忽然 发 现 满 店 的 人 都 注视 着 她 
们 ,有 抽 鼻 的 ,有 挤 眼 的 ,有 报 嘴 的 ,一 屋子 不 属 的 神色 。( 储 引 ， 
343) 


上 文 说 这 种 能 跟 * 满 全 ?交替 的 “一 ”表达 的 是 一 种 浑然 一 体式 的 意 
象 图 式 * 有 趣 的 是 ,我 们 的 古人 对 “一 ”的 这 种 意义 特点 是 有 很 深刻 的 
理解 的 。 比 如 ,东汉 许 慎 在 《说 文 解 字 》 中 对 “一 ”的 解释 是 惟 初 太 
始 , 道 立 于 一 , 造 分 天 地 ,化 成 万 物 ”( 第 7 页 ).@《 辞 海 。 语词 分 册 》 
对 “一 ”的 解释 更 为 直截了当 :" 满 ;全 。 如 : 一 天 星斗 。 李 煜 (清平 
乐 》? 词 :“ 动 下 落 梅 如 雪 乱 , 拂 了 一 身 还 满 ?”( 第 1 页 ).@《 现 代 汉 语 
词典 》 基 本 沿袭 这 种 解释 :…“ 满 ;全 : 一 冬 | 一 生 | 一 路 平安 | 一 屋子 人 | 
一 身 的 汗 ”( 第 1471 页 ) @ 
Chao (1968) 把 “一 ` 满 全 \ 整 . 半 、 几 多 、 多 .多少 . 许 多 、 好 多 、 
好 几 、 很 多 ”等 称 为 数量 限定 词 (quantitative determinative), 认为 它 
们 介 于 特 指 限定 词 ( 如 : 每 ( 张 纸 )、 各 ( 国 的 政府 )、 某 (个 人 )、 本 (次 
大 会 )) 和 数 词 (如 : 一 二 三 ) 之 间 ; 指 出 这 种 词 不 给 出 确切 的 数目 ， 
只 指出 相对 的 数目 或 未 知 的 数目 (用 于 问 话 时 ) 。 赵 先生 对 这 种 数量 
限定 词 “一 ”的 读音 有 一 个 极 好 的 说 明 : 这 种 “一 ”有 完整 的 重音 和 变 
调 , 即 是 重读 而 又 有 平常 的 变调 。 跟 没有 变调 .表示 真正 一 个 的 “一 ” 
不 同 。 例 如 : 


(14) a。 只 要 一 块 钱 ”b. 只 要 (一 ) 块 布 


(14a) 中 的 “一 ”是 加 重音 的 数 词 , 指 真 正 一 块 钱 ;(14b) 中 的 “一 ”( 包 
括 量词 “ 块 27 是 轻声 ,可 以 省 掉 , 意 思 是 随便 任何 一 块 布 。 数 量 限 定 
词 “ 一 ”的 意思 是 “ 满 >"“ 全 ”“ 整 "之 类 ,后 头 不 能 用 个 体 量 词 ( 单 位 
词 ) 标准 (度量 衡 ) 量 词 和 动量 词 ,只 用 临时 量词 或 容器 量词 ;而且 往 


@ 《说 文 解 字 》, 据 中 华 书局 1979 年 影印 本 ,以 下 简称 《说 文 》。 
@ 据 上 海 人 民 出 版 社 1977 年 版 。 
图 ” 据 商 务 印 书馆 1996 年 版 修订 本 。 
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往 加 上 ”的 ? 跟 一 个 名 词 ,当然 也 可 以 不 加 名 词 。 例 如 :Q 


(15) a. 一 脸 的 脏 b. 一 屋子 的 烟 
c.， 你 看 你 酒 的 一 身 的 d. 一 路 下 十 


可 见 ， 一 ` 满 全 ”等 词 在 意义 和 用 法 方面 有 许多 相似 性 ,而 这 种 相似 
性 又 可 以 追溯 到 这 些 词 的 意义 结构 背后 具有 相似 的 隐喻 投射 Cmeta- 
phor projection) 和 意象 图 式 。 


5 配偶 图 式 " 双 "和 平分 图 式 “ 两 ” 


根据 上 文 的 讨论 ,我 们 可 以 说 :“ 满 ”能 够 激活 (activate) 容器 这 . 
种 意象 图 式 ， 全 ”能 够 激活 套件 这 种 意象 图 式 。 由 于 汉字 基本 上 是 
一 种 表意 文字 ,因而 我 们 自然 要 追究 : 这 种 意象 图 式 在 相应 的 汉字 
的 字形 上 有 没有 一 定 的 反映 呢 ? 寻找 答案 的 最 简单 的 办 法 是 查 《 说 
文 }?。《 说 文 》 对 “ 满 ?的 说 解 是 :和 盈 溢 也 ,从 水 世 声 ”( 第 231 页 ) 。 从 
字形 上 似乎 看 不 出 一 点 容器 的 痕迹 。 但 是 , 它 的 同义词 “ 盈 ” 和 “ 溢 ” 
倒是 极 具 启 发 性 的 。《 说 文 》 对 会 意 字 “ 盈 ” 的 说 解 是 :“ 满 器 也 ,从 严 
房 声 ” 第 104 页 ) ;对 形声 字 “ 溢 ”的 说 解 是 :“ 器 满 也 ,从 水 益 声 ”( 第 
236 页 ); 对 会 意 字 “ 益 ? 的 说 解 是 : “化 也 ,从 水 亚 , 亚 溢 之 意 也 ”( 第 
104 页 )。 显 然 , 从 “ 满 ” 的 同义词 “ 盈 . 溢 、 益 ”等 的 字形 上 ,可 以 清楚 
地 看 出 容器 这 种 意象 图 式 在 这 些 词 的 意义 结构 中 的 作用 .《 说 文 》 对 
“全 ”( 古 文 为 全”) 的 说 解 是 :“ 完 也 ,从 人 从 工 ”( 第 109 页 ) ,对 形声 
字 “ 完 ”的 说 解 是 :全 也 ,从 汪 元 声 ”( 第 150 页 ) 。 从 字形 上 似乎 看 不 
出 一 点 套件 的 痕迹 。 但 是 , 跟 它 们 意义 相关 的 “ 齐 ” 倒 是 具有 一 定 的 
启发 性 的 .2 《说 文 》? 对 象 物 字 式 的 象 事 字 “ 齐 ”的 说 解 是 :“ 禾 麦 吐 穗 


@ 详 见 Chao (1968)，p. 578, 全 译本 第 487 页 ; 节 译 本 第 260 页 。 
@ “ 齐 ? 的 本 义 是 整齐 .一 致 ,后 来 逐步 引申 出 一 同和 一 齐 、 同 等 .齐全 等 意义 。 例 
如 : 〈 引 自 《 古 汉语 常用 字 字 典 》, 商 务 印 书馆 ,1993 年 版 ,第 223 页 ) 
(1) 夫 物 之 不 齐 , 物 之 情 也 。(《 孟 子 。 腾 文公 上 )》) 
《2) 齐 喝 田 中 歌 。( 刘 丙 锡 ( 插 田 歌 访 
〈《3) 与 天 地 今 比 寿 ,与 日 月 今 齐 光 。 〈 属 原 ( 九 章 。 涉 江 》) 
4) 佳期 别 在 春山 里 ,应 是 人 参 五 叶 齐 。( 韩 友 ( 送 客 至 潞 府 》) 
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上 平 也 ,象形 (第 143 页 ) 。 可 见 ,我 们 的 先哲 是 用 他 们 最 熟悉 的 “条 
麦 吐 穗 上 平 > 这 种 形象 ,来 反映 他 们 对 于 “ 齐 ” 的 整齐 义 的 意象 图 式 
的 。 这 正好 印证 了 Anderson(1990: 133) 的 断言 : 图 式 表达 感知 信 
息 ,不 同 于 命题 所 表达 的 意义 ;图 式 用 以 对 范畴 的 典型 特征 进行 编 
码 。 我 们 的 先哲 在 蔡 整 齐 义 的 qi 这 个 词 造 字 时 ,2 用 他 们 最 容易 想 
到 的 、 最 典型 的 齐 刷 刷 的 稻 / 麦 穗 来 代表 他 们 心理 上 关于 整齐 的 意象 
图 式 。 可 见 , 从 词义 的 意象 图 式 的 角度 来 分 析 , 有 助 于 了 解 造 字 意 图 
跟 词 的 本 义 之 间 的 复杂 关系 .@ 粗略 地 说 ,字形 有 的 时 候 通过 全 部 
或 部 分 地 描摹 形象 来 直接 地 反映 词义 的 意象 图 式 、 并 表示 词 的 本 义 ; 
比如 “ 盈 . 益 \ 溢 ?之 类 ,可 以 叫 直接 临摹 (Cdirect icon); 有 的 时 候 通过 
举例 性 地 描摹 形象 来 间接 地 反映 词义 的 意象 图 式 、. 并 表示 词 的 本 义 ; 
比如 “ 齐 ” 之 类 ,可 以 叫 间 接 临摹 (Cindirect icon) 。 

下 面 , 我 们 讨论 直接 临摹 的 一 对 词 及 其 字形 。 傅 力 (1996) 在 王 
力 (1980: 248 一 252) 的 有 关 讨 论 的 基础 上 ,经 过 仔细 体会 发 现 : 在 
古代 汉语 中 ，“ 双 ”和 “两 ?虽然 都 指数 目 “ 二 ”, 但 意义 和 用 法 却 不 同 。 
“ 双 ” 在 句 中 突出 化 二 为 一 ,强调 两 者 的 配合 。 例 如 :9 


C1) 凯 子 暗 与 弟 蕉 子 , 并 有 时 誉 ,洛阳 令 员 想见 其 兄弟 , 叹 
日: 仆 以 年 老 , 更 睹 双 壁 。"( 北 史 ， 陆 凯 传 ) 

《2) 客 从 远方 来 , 遗 我 双 鲤 鱼 。( 莹 名 《 饮 马 长 城 窝 行 办 

(3) (和 孙 ) 权 投 以 双 戟 。( 三 国志 。 吴 书 。 有 吴 主 传 ) 

(4) 卢 家 少妇 郁金香 , 海 惹 双 栖 珠 班 梁 。( 沈 丛 期 ( 独 不 
见 汶 


@ 很 抱 圾 ,在 这 里 我 们 暂且 用 “ 齐 ” 的 现代 音 来 代表 其 当时 的 古音 。 另 外 ,关于 表意 
字 、 象 物 字 、 象 物 字 式 的 象 事 字 和 形声 字 等 汉字 类 型 方面 的 概念 ,参考 东 锡 圭 (1990) 第 七 
章 : 表意 字 , 第 110 一 150 页 ;第 八 章 : 形声 字 , 第 151 一 178 页 。 

@ 关于 字形 和 词 的 本 义 之 间 的 关系 ,请 看 故 锡 圭 (1990) 第 七 章 第 二 节 : 字形 在 词义 
研究 上 的 作用 ,第 142 一 150 页 ;第 八 章 第 七 节 : 声 旁 跟 字 义 的 关系 ,第 175 一 178 页 。 

四 ”对 于 傅 力 (1996) 的 有 关 令 述 ,本 文 稍微 作 了 一 些 改动 ,举例 也 参照 王 力 (1980) 和 
有 关 辞 书 作 了 调整 。 例 (3) 转 引 自 《4 古 汉语 常用 字 字 典 》 第 265 页 , 例 (72(8) 转 引 自 《 王 力 
古 汉语 词典 》( 中 华 书 局 ,2000 年 ) 第 1611 页 。 
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(5) 和 八 月 蝴蝶 来 ,双飞 西 园 草 。( 李 和 白 ( 长 干 行 

《6) 何 日 全 庶 名 , 双 照 泪痕 干 。( 杜 甫 (月夜 》) 

《7) 其 禽 加 于 一 双 , 则 执 一 双 以 将 命 , 委 其 余 。( 礼 记 。 少 
仪 ) 

(8) 我 持 白 壁 一 双 , 和 欲 献 项 王 , 玉 斗 一 双 , 欲 与 亚 父 。( 史 
记 。 项 羽 本 纪 ) 

〈9) 双 免 傍 地 走 , 安 能 办 我 是 雄 叭 ? (木兰 诗 ) 

《10) 得 双 石 于 潭 上 ， 忠 而 聆 之 。( 苏 轼 《 石 钟 山 记 》 


例 (1) 一 (3) 中 的 “ 双 ? 强 调 事物 的 配合 成 对 , 例 (4) 一 (6) 中 的 “ 双 ? 强 
调动 作 ,行为 的 配合 , 例 (7) 一 (8) 中 的 “ 双 ? 强 调 事物 的 单位 是 两 个 一 
对 , 例 (9) 一 (10) 中 的 “ 双 ? 强 调 事物 的 数量 是 成 对 的 两 个 .“ 双 ”的 这 
种 意义 特点 跟 其 造 字 本 义 是 吻合 不 悖 的 《说 文 》 对 “只 ”( 繁 体 为 
“ 焦 ”) 的 说 解 是 : 鸟 一 枚 也 ,从 又 持 佳 。 持 一 佳 日 焦 ,二 佳 日 色光 (第 
76 页 ) ,对 “ 双 ?( 繁 体 为 “ 复 ?) 的 说 解 是 :“ 售 二 枚 也 ,从 俊 又 持 之 ”( 第 
79 页 )。 显 然 “ 双 ?的 造 字 意图 是 用 一 只 手 捉 两 只 鸟 的 形象 来 表示 
合 二 为 一 \ 配 成 一 对 这 种 本 义 。 这 种 字形 比较 直接 地 表示 了 “ 双 ” 的 
这 种 合 二 为 一 \ 配 成 一 对 意义 特点 背后 的 意象 图 式 ““ 合 而 成 对 ' 可 
以 简称 为 配偶 图 式 (one-pair scheme) 。 

而 “两 ”的 意义 特点 是 表示 自然 界 、. 社 会 上 一 种 平分 为 二 的 现象 ， 
其 最 初 的 用 法 是 表示 具有 分 而 为 二 特点 的 事物 的 数量 或 单位 。 例 
如 : 


《11) 葛 彼 两 曼 , 实 维 我 仪 。( 诗 经 。 角 风 。 柏 舟 ) 

《12) 两 造 具 备 。( 书 经 。 吕 刑 ) 

《13) 易 有 太极 ,是 生 两 仪 。( 易 。 系 荐 下 ) 

(14) 我 中 其 两 端 而 竭 看。( 论 语 。 子 罕 ) 

(15) 我 两 痢 将 绝 。( 左 传 。 哀 公 二 年 ) 

《16) 五 管 在 上 ,两 牌 为 肋 。( 庄 子 。 人 间 世 ) 

《17) 两 滩 渚 崖 之 间 ，, 不 辩 牛 马 。( 庄 子 。 秋 水 ) 

《18) 之 子 于 归 ，, 百 两 衔 之 。( 诗 经 。 召 南 。 鸥 梨 ) 

《19) 与 其 誉 竞 而 非 穆 ,不 如 两 忘 而 闭 其 所 誉 。( 庄 子 。 外 
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物 ) 
(20) 和 亚 铅 两 用 公 仲 公 叔 其 可 乎 ?〈 战 国策) 


例 (11) 中 的 “ 旷 ? 指 朝 前 向 两 边 分 梳 为 二 、 下垂 至 丑 的 长 发 , 例 (12) 
中 的 “ 造 ? 通 “ 草 ”, 指 诉讼 的 双方 ; 例 (13) 中 的 “ 仪 ? 指 太初 之 时 浑然 
一 体 的 元 气 判 分 为 二 ,形成 天 地 ,化 为 阴阳 的 现象 ; 例 (14) 中 的 
“ 端 ? 指 事物 的 一 头 或 一 方 , 事 物 一 般 有 头 尾 或 始末 两 端 ; 例 (15) 中 
的 “ 间 |” 指 缠 束 在 马 胸部 用 来 牵引 车 轴 的 两 条 皮带 , 例 (16) 中 的 
“ 钥 ? 指 人 体 两 股 的 外 部 ; 例 (17) 中 的 “ 汉 ? 指 水 边 ,一 条 河 通常 有 两 
条 边 岸 。 上 面 的 “两 ”是 数 词 , 作 定语 修饰 名 词 。 例 (18) 中 的 “两 ” 
是 量词 “ 百 两 ”是 数量 词组 称 代 中 心 语 “ 车 ”; 车 子 最 显著 的 特征 是 
有 两 个 轮子 ,所 以 用 “两 ?为 单位 ;直到 现在 “两 ”仍然 沿用 作为 车 
的 单位 ,只 是 字形 上 增益 形 旁 ,写作 “ 辆 ”。 例 (19)(20) 中 的 “两 > 修 
饰 动词 性 成 分 ,表示 在 某 种 意义 上 具有 对 立 性 的 两 种 行为 。 在 上 
面 的 例子 中 , 受 “ 两 ”修饰 的 名 词 所 指 的 事物 都 具有 分 而 为 二 、 两 相 
对 立 的 特点 。“ 两 ”的 这 种 意义 和 用 法 特点 跟 其 造 字 本 义 也 是 吻合 
不 悖 的 .“ 两 ”最 初 写 为 “ 朵 ”。《 说 文 》 对 “了 末 ?” 的 说 解 是 :再 也 ,从 
门 阙 。”( 第 157 页 ) ,在 “两 ”下 云朵 ,平分 ”( 第 157 页 )。《 说 文 》 
对 “ 门 的 说 解 是 :“ 邑 外 谓 之 郊 , 郊 外 谓 之 野 , 野 外 谓 之 林 , 林 外 谓 
之 门 , 象 远 界 也 ”( 第 110 页 ) 。 据 此 ，, 倩 力 (1996: 382) 认 为 “ 朵 ?的 
字形 示意 在 于 平分 ,表示 自然 界 、. 社 会 上 一 种 平分 为 二 的 现象 。 显 
然 “ 朵 ”的 造 字 意 图 是 用 介 空 两 人 的 字形 来 表示 分 而 为 二 两 相对 
立 这 种 本 义 .9 这 种 字形 比较 直接 地 表示 了 “两 ”的 分 而 为 二 、 两 相 
对 立 这 种 意义 特点 背后 的 意象 图 式 一 一 分 而 为 二 ,可 以 简称 为 平分 
图 式 (Ctwo-halves scheme) 。 

对 于 两 个 关系 密切 、 经 常 一 起 出 现 的 事物 ,人 们 可 以 突出 其 相互 
配合 的 一 方面 , 即 把 这 种 现象 归 y 人 配偶 这 种 意象 图 式 之 中 ,于 是 可 以 
用 “ 双 ? 来 强调 这 两 者 之 间 的 配偶 成 双 的 关系 ;也 可 以 突出 其 相互 对 
立 的 一 方面 , 即 把 这 种 现象 明和 人 平分 这 种 意象 图 式 之 中 ,于 是 可 以 用 


@。 承 沈 培 先生 告知 《说 文 ? 对 “两 的 说 解 是 不 可 信 的 ;有 人 认为 在 字形 上 “两 "是 两 
个 “两 >”，“ 丙 ?是 马 屁股 的 象形 。 古 代 常 用 两 匹 马 拉 车 ,所 以 用 “两 ? 作 车 的 单位 。 
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“两 ”来 强调 这 两 者 之 间 的 分 而 为 二 的 关系 。 例 如 : 


(21) a. 葛 展 五 两 ， 种 对 又 上。 (诗经 。 齐 风 。 南山 ) 
b. 未 知 一 生 当 着 几 重 涯 。( 世 说 新 语 。 雅 量 ) 
〈22) a。 愿 君 坚 塞 两 耳 ， 元 天 头 对 轩 | 〈 战 国策 。 赵 策 ) 
b. 遂 坐 而 下 险 ， 以 双 足 向 前 ,两 手 反而 后 揣 草 根 。 
(徐霞客 游记 。 滇 游 日 记 ) 
《23) 两 水 天 明镜 , 双 桥 落 彩虹 。( 李 白 《 秋 有 登 宣 城 谢 胱 北 
楼 


在 例 (21) 中 ,“ 绥 ”( 帽 子 上 的 球 带 ) 用 “ 双 ” 来 形容 ,大 概 是 为 了 突出 其 
相互 配对 的 特征 。 鞋 类 后 世 通 常用 “ 双 ” 作 量词 ,这 里 的 “ 展 ( 草 鞋 )、 
展 ? 却 用 “两 ( 量 )”; 这 是 为 了 突出 其 分 而 为 二 的 特征 ,还 是 当时 的 
“两 ”只 是 如 王 力 (1980: 251) 所 言 强调 “天 然 成 双 的 事物 ”( 即 不 是 傅 
力 (1996: 382) 所 言 “ 侧 重 平分 ” ,还 是 因为 “ 双 ? 在 先秦 时 代 刚 刚 出 
现 、 还 不 成 熟 ,2 这 个 问题 还 需要 作 进 一 步 的 研究 。 至 于 例 (22) 中 的 
“ 耳 . 手 . 足 ” 用 “两 ”还 是 ^“ 双 ”, 似 乎 有 点 儿 随 意 ,这 说 明 “ 两 "和 “ 双 ?” 在 
一 定 的 语 境 中 是 可 以 中 和 化 的 。 例 (23) 中 对 举 的 “两 ”和 “ 双 ” 似 乎 并 
非 随意 所 为 ,而 是 为 了 塑造 特定 的 文学 形象 : 绕 宣 城 的 句 溪 和 宛 溪 
两 条 河流 ,相对 而 流 、 相 互 辉映 ,宛如 明镜 ; 宛 溪 上 的 凤凰 桥 和 济 川 
桥 , 上 下 配合 ,犹如 一 对 彩虹 横 跨 溪 上 。 这 样 看 来 ,词义 的 意象 图 式 
在 微观 上 对 字形 的 设计 有 重要 的 影响 ,在 宏观 上 对 文学 形象 的 塑造 
也 有 积极 的 影响 。 

“ 双 ” 罕 出 配合 成 偶 , 强 调 合作 、 合 并 玉 两 ?突出 平分 对 立 ,强调 对 
抗 、 分 裂 。 这 种 意象 图 式 特点 在 一 些 流 传 至 今 的 成 语 中 得 到 鲜明 的 
反映 。 例 如 : 


〈24) 成 双 成 对 一 两 两 相对 比 要 双飞 一 势 不 两 立 。 名利 
双 收 一 人 财 两 空 


推广 开 来 ,汉语 量词 “ 双 . 对 、 套 、 副 ?等 跟 名 词性 成 分 的 搭配 限 


@ 王 力 (1980) 指 出 ,在 先秦 时 代 “ 双 ? 字 罕 见 :《 诗 经 》1 见 《 墨 子 》1 见 《 庄 子 》1 见 
(还 是 在 可 疑 的 4 盗 距 》 篇 ) 《荀子 》 中 未 见 ( 第 252 页 及 其 注 2) 。 
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制 ,都 可 以 从 意象 图 式 的 角度 进行 分 析 , 并 能 得 到 合理 而 充分 的 解 
释 。 


6 隐喻 和 意象 图 式 的 跨 平 面 性 、. 
超 范畴 性 和 超 语 癌 


从 "“ 满 全? 和”" 双 两 ?等 的 使 用 来 看 ,其 背后 的 隐喻 和 意象 图 式 
的 作用 具有 跨 平 面 的 特点 。 它 们 既 可 以 作为 构 词 语素 在 词法 平面 上 
黏着 运用 ,又 可 以 作为 独立 的 词 在 句法 平面 上 自由 运用 ;在 这 些 不 同 
的 平面 上 ,其 背后 的 隐喻 和 意象 图 式 是 不 变 的 。 例 如 :9 

(1) 满 额 满分、 满怀 满门、 满面 满目 、 满 期 、 满 七 满腔、 

满 师 、 满 天 满心、 满眼 满意 、 满 员 、 满 月 满载、 满嘴 、 满 足 、 满 

座 , 满 登 登 满堂 红 ; 饱 满 、 爆满、 充满 丰满 \ 服 满 、 届 满 、 客 满 、 美 

满 、 期 满 \ 完满、 圆满 \ 秩 满 ; 满 不 在 乎 、 满 城 风 雨 、 满 面 春风 、 满 目 

郊 关 、 满 园 春 色 、 满 载 而 归 、 脑 满 肠 肥 、 心 满意 足 \ 净 关 满 目 春 风 

满面 . 恶 叶 满 盈 、 琳 琅 满 目 ; 满 打 满 算 、 满 坑 满 谷 

(2) 全 鹏 、 全 部 、 全 本 、 全 才 、 全 场 、 全 长 全称、 全 程 、 全 份 、 

全 副 全 国 、 全 家 、 人 全集、 全 景 、 全 局 、 全 军 、 全 力 、 人 全貌、 全 面 、 全 

民 、 全 能 、 全 年 、 人 全盘、 全票、 全球、 全权、 全 然 、 人 全书、 全数 、 全 过 、 

全 套 、 人 全体、 全托、 全 文 、 全 息 、 全 县 全 线 、 全 新 、 全 音 , 全 日 制 ; 安 

人 全、 保全、 成 全 、 苘 全 、 顾 全 、 健 全 、 两 全 、 齐 全 、 求 全 、 十 全 、 双 全 、 

瓦 全 、 完 全 、\ 万 全 、 圆 全 、 周 全 ,日 全 食 ; 全 力 以 赴 、 全 神 呐 注 \ 两 全 

其 美 . 求 全 责备 十全十美、 百科 全 书 、 凋 尽 全 力 \ 面目全非 、 目 无 

全 牛 、 全 始 全 终 、 人 全心全意 、 全 知 全 能 、 委 曲 求全 、 一 应 俱全 、 智 勇 

双全 

(3) 双边 双 桥 、 双重、 双打 \ 双方 \ 双 份 、. 双 幅 、 双 杠 、 双 钧 、 
双关 、 双 轨 、 双 簧 双料、 双亲 、 双 全、 双 日 双生、 双 声 、 双 手 、 双 
数 、 双 糖 , 双 喜 \、 双响 、 双 向 \ 双 薪 、 双 星 , 双 胞 胎 、 双 立 人 ; 双 管 齐 


@ 参考 4 现代 汉语 词典 》( 商 务 印 书馆 ,1996) 和 傅 兴 岭 、 陈 章 焕 主编 (1982)《 常 用 构 
词 字典 》 中 国人 民 大 学 出 版 社 ) 等 辞书 , 恕 不 一 一 具 指 。 
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下 、 一 箭 双 膨 、 智 勇 双全 、 举 世 无 双 

《4) 两 半 \ 两 边 \ 两 便 、 两 颂 \ 两 侧 \ 两 托 ` 两 地 \ 两 端 \ 两广 、 
两 汉 \、 两 湖 、 两 极 \ 两江 \ 两 可 \ 两 肋 、 两 立 \ 两 利 \ 两 免 两 面 、 两 
难 \ 两 旁 \ 两 栖 \ 两 论 、 两 全 、 两 手 两头 两 厅 、 两性、 两 样 、 两 翼 、 
两 造 、 两 者 ,两 重 性 ;两 败 俱 伤 、 两 面 三 刀 \ 两 全 其 美 \ 两 相 情愿 、 
两 小 无 猜 ,两 褐 清风、 进退两难、 模棱两可 、 势 不 两 立 、 首 鼠 两 端 、 
一 刀 两 断 、 一 举 两 得 、 一 身 两 役 、 依 违 两 可 


这 些 都 是 构 词 平 面 上 的 例子 ,至 于 造句 平面 上 的 例子 请 看 上 文 , 这 里 
就 不 再 重复 了 。 

“ 满 、 全 ”和 ”“ 双 两 ?还 有 超 范畴 性 的 特点 , 即 具 有 不 同 的 词类 功 
能 ,充当 不 同 的 句法 成 分 。 比 如 ,从 上 文 所 举 的 例子 可 以 看 出 :“ 满 ” 
有 了 形容词 (如 : 满 饭 桌 ) 动词 (如 : 满 上 这 人 一杯) 副词 (如 : 满 不 是 那 

一 回 事 ) 等 用 法 ,从 而 有 作 定 语 (如 : 满 办 公 室 )、. 谓 语 ( 如 : 水 库 满 
了 ) 、 补 语 ( 如 : 客厅 里 挤 满 了 人 ) .状语 (如 : 屋 检 上 满 挂 着 冰凌 ) 等 
句法 功能 ”全 ”有 形容 词 ( 如 : 全 农场 )、 副 词 ( 如 : 那 几 箱 水 果 全 烂 
了 ) 等 用 法 ,从 而 有 作 定 语 ( 如 : 全 世界 ). 谓 语 ( 如 : 配料 全 了 ) 、 补 语 
(如 : 配 全 了 ) ,状语 (如 : 这 些 全 是 水 货 ) 等 句法 功能 ; 双 ” 在 古代 汉 
语 中 有 数 词 (如 : 双 免 ) 量 词 ( 如 : 玉 斗 一 双 ) 动词 (如 : 其 象 无 双 ， 
国士 无 双 ) 等 用 法 ,从 而 有 作 定 语 ( 如 : 双 桥 ) 中心 语 (如 : 一 双 ) 和 
谓语 核心 (如 : 无 双 ) 等 句法 功能 交 两 ”在 古代 汉语 中 也 有 数 词 (如 : 
两 宫 )、 量 词 (如 : 百 两 第 之 、 葛 展 五 两 ) 动词 (如 : 一 时 无 两 ) 等 用 
法 ,从 而 有 作 定 语 ( 如 : 两 军 阵 前 )、 中 心 语 ( 如 : 百 两 ) 和 谓语 核心 
(如 : 无 两 ) 等 句法 功能 。 

有 意思 的 是 ,在 上 述 不 同 的 语法 单位 层级 、 不 同 的 词 半 范畴 和 结 
构 功 能 的 情况 下 ，" 满 全 2 和“ 双 、 两 ” 背后 的 隐喻 和 意象 图 式 的 作用 
却 是 始终 不 变 的 。 更 有 意思 的 是 , 跟 容 器 .套件 隐喻 和 意象 图 式 相关 
的 不 仅 是 “ 满 2? 和 “全 ”, 而 且 还 有 ”深浅 .空缺 . 齐 . 套 、 副 、. 双 .对 ”和 
“ 半 ” 以 及 上 文 讨论 过 的 “一 ?等 词语 。 例 如 :9 


@ 参考 4 现代 汉语 词典 》( 商 务 印 书馆 ,1996) 和 傅 兴 岭 、 陈 章 焕 主 编 (1982)《 常 用 构 
词 字典 兴 中 国人 民 大 学 出 版 社 ) 等 辞书 , 恕 不 一 一 具 指 。 
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书馆 
C7J .二 


b. 


(8) a. 


(9 
意 、 深 渊 
b. 


C。 


这 口 并 很 深 / 浅 ， 那 间 房 子 太 深 / 浅 了 


. 这 本 书 太 深 / 浅 ”他 们 俩 感情 很 深 / 浅 


房子 空 着 没 人 住 “她 把 抽 层 腾空 了 操场 上 空 无 


.他 的 话 太 空 , 不 解决 问题 这 篇 文章 很 空 ,没有 什 


. 把 前 面 几 排 座位 空 出 来 ” 空 出 一 天 时 间 购 物 和 旅 


. 车 厢 里 空 得 很 
-. 屋 里 连 站 脚 的 空 儿 也 没有 ”抽空 儿 去 一 赵 北 京 图 


一 班 全 了 ,二 班 还 缺 两 个 学 生 “小 王 还 缺 四 个 学 分 
这 本 书 缺 了 两 页 她 又 缺 了 一 次 课 

五 十 双手 套 配 齐 了 一 套 《全 宋 诗 》 买 齐 了 

一 副 扑 克 牌 缺 了 三 张 ” 一 对 网 圾 飞 了 一 只 

深 半 、 深 海 、 深 交 、 深 情 、 深 秋 、 深 山 、 深 思 、 深 夜 、 深 


满 挡 一 空挡 、 满 腹 一 空腹 、 满 怀 一 空 怀 、 满 口 一 空 


口 、 满 门 一 空门 、 全 身 一 空 身 、 满 城 一 空城 、 满 勤 一 缺勤 、 满 员 人 ~ 
缺 员 、 满 月 一 缺 月 


d. 


e。 


全 额 一 缺额 全 套 一 缺 门 全 勤 一 缺勤 
一 百 一 半 百 、 全 鹏 一 半 鞠 ?全 饱 一 半 饱 、 全 岛 一 半 


岛 、 全 价 一 半价 、 一 截 一 半截 、 全 年 一 一 年 一 半年 、 全 票 一半 票 、 
全 导 之 半日 、 一 生 汪 年生 ) 满 条 一 全 责 僵 一 直人 生息 于 吉 。 一 
世人 一半 世 、 全 天 一 一 天 一 半天 、 一 路 一 半途 、 全 夜 一 一 夜 一 整 夜 
一 半夜 、 全 音 一 半音 、 全 影 一 半 影 

在 (5a) 中 ,把 井 和 房子 当 作 容 器 来 谈论 其 深浅 。(5b) 则 稍微 复杂 一 


点 ,把 书 和 人 体 当 作 容 器 ,把 书 中 的 内 容 和 感情 当 作 容 物 ; 然 后 ,再 来 
谈论 其 深浅 ( 即 容 物 对 容器 的 占有 程度 )。 在 (6a,b) 中 ,“ 空 读 


kong, 是 形容 词 ; 


在 (6c 一 e) 中 ， 空 ? 读 kong, 是 动词 和 名 词 ( 不 睁 化 
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时 是 由 形容 词 直接 转 指 成 名 词 , 儿 化 后 是 由 形容 词性 成 分 加 上 转 指 
标记 而 形成 的 名 词 形式 )。 从 (7) 一 (8) 可 以 看 出 , 跟 * 满 ,全 ”有 同 义 、 
反 义 关系 的 “ 缺 \ 齐 ?都 可 以 用 容器 .套件 隐喻 和 意象 图 式 来 解释 。 
(9) 则 说 明 跟 * 满 ,全 ”相关 的 “ 深 ,` 浅 、 空 ` 缺 一、 浑 . 整 . 半 ? 在 构 词 时 ， 
依然 可 以 用 容器 、 套 件 隐喻 和 意象 图 式 来 解释 其 造 词 的 语义 理据 


(semantic motivation ) 。 


值得 注意 的 是 ,容器 套件 隐喻 及 其 意象 图 式 也 可 以 用 来 解释 英 


语 中 的 一 些 现象 。 比 如 , 像 名 词 cabacity 和 动词 fill 等 是 跟 容 器 隐 
喻 及 其 意象 图 式 相 关 的 。 例 如 : 


(10) a. The assembly hall was filled to capacity.( 大 会 堂 

里 挤 满 了 人 ) 

b. So many people came that the hall7s capacity was 
exceeded. (来 予 这 么 多 人 ,以 至 于 大 厅 里 都 装 不 下 了 ) 

c. a seating. capacity of 1 ,000(1,000 个 人 :的 座位 )， 

d._ acapacity audierice( 满 座 的 听 / 观 众 ) 

e. breathing (or vital) capacity( 肺 活 : 量 )、capacity 
tonnage( 载 重量 ) 

fa capacity tolearn (or for/of learning) languages 
(学 语言 的 能 力 ) 

g. He has a mind of great capacity. (他 接受 力 很 强 ) 

h. oneys: capacity as a leading cadre( 领 导 干 部 的 地 


i。in the capacity of (以 ，……， 的 资格 ) 
(11) a. John filled a glass with water. (约翰 在 杯子 里 装 满 
了 水 ) 
b. Sounds of drums and gongs filled the air. (锣鼓 声 
充满 了 天 空 ) 
c. be filled with( 装 满 ) 


@ 举例 引 自 《新 英汉 词典 》( 上 海 译文 出 版 社 ,1985) 等 辞书 , 想 不 一 一 具 指 。 
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d.， This young cadre fills the office satisfactorily.《〈 这 
位 青年 干部 非常 称职 ) 


在 (10a 一 e) 中 ,名 词 capacity 通过 容器 隐喻 , 指 比较 实在 的 容积 、 容 
量 ; 在 (10f 一 D 中 , 则 指 更 为 抽象 的 能 力 、 智 能 乃至 职位 .资格 等 ;也 
就 是 说 ,在 人 们 的 经 验 结构 中 , 他们 把 人 的 能 力 、 智 能 .职位 .资格 都 
看 成 是 一 种 容器 。 在 (11a 一 c) 中 ,动词 fill 用 以 指 填 满 比较 实在 的 
容器 一 一 杯子 .天 空 ; 而 在 (llc) 中 , 则 用 以 指 填 满 比较 抽象 的 容 
器 一 一 职位 。 在 同一 种 容器 意象 图 式 的 约束 下 ,动词 和 相应 名 词 的 
配合 十 分 和 谐 。 而 像 component， compound， compose，construct， 
assemble 等 词 是 跟 套 件 隐 喻 和 意象 图 式 相关 的 。 例 子 从 略 。 

上 面 的 讨论 正好 印证 了 Lakoff 等 认 知 语言 学 家 的 “隐喻 的 认 知 
观 ” 的 下 列 三 个 结论 : (1) 隐喻 的 普遍 性 : 隐喻 是 语言 的 常态 ,是 人 
们 在 使 用 语言 时 无 须 努 力 就 会 自动 地 冒 出 来 的 无 意识 的 东西 。(2) 
隐喻 的 系统 性 : 隐喻 不 是 个 别 地 、 随 意 地 制造 出 来 的 ,而 是 有 系统 
的 ,可 形成 某 种 结构 化 的 隐喻 群 。(3) 隐喻 的 概念 性 : 隐喻 不 光 是 
个 语言 问题 , 它 更 是 一 种 思维 方式 ;思维 过 程 本 身 就 是 隐喻 性 的 ,我 
们 赖 以 思考 和 行动 的 概念 系统 大 多 是 以 隐喻 的 方式 建构 和 界定 
的 .9 在 这 里 ,我 们 要 补充 的 是 : 从 “ 满 2? 和 ”全 ”及 相关 的 语言 表达 形 
式 上 可 以 看 出 ,隐喻 决定 了 语言 的 选择 和 使 用 ,特别 是 词语 之 间 的 同 
现 限 制 。 


7 隐喻 表达 的 图 式 解剖 和 计算 分 析 


不 同 的 隐喻 反映 人 们 感知 事物 和 事件 时 的 不 同 的 认 知 方式 ,从 
而 构成 了 关于 某 种 事物 和 事件 的 不 同 的 意象 。 意 象 ( 或 比 之 更 具体 
的 心 象 ) ,是 一 种 不 在 眼前 的 物体 或 事件 的 心理 表征 。 比 如 , 当 有 人 
要 你 回忆 童年 时 代 在 其 中 度 过 大 部 分 时 光 的 房子 时 ,你 会 在 他 的 要 
求 下 产生 该 房子 的 心理 意象 ,该 意象 极 像 一 张 心理 照片 。 也 就 是 说 ， 


@ ， 详 见 张 敏 (1998) ,第 90 一 91 页 。 
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在 你 心灵 的 眼睛 (mind”s eye) 中 ,你 可 能 意识 到 房子 的 意象 突然 排 
列 在 你 的 眼前 。 但 是 ,实际 上 你 的 头脑 中 并 没有 照片 。 显 然 ,意象 像 
照片 , 却 又 不 是 照片 。 那 么 意象 到 底 是 什么 ? 如 何 解释 它 的 存在 ? 
在 抽象 的 .经验 性 的 心理 分 析 层 面 上 ,心理 学 家 有 形象 编码 和 概念 编 
码 等 学 说 ;这 些 不 同 的 学 说 都 能 成 功 地 解释 一 些 现 象 , 也 都 面临 着 无 
法 解释 某 些 现象 的 困境 。 在 具体 的 .物质 的 大 脑 一 神经 的 分 析 层 面 
上 ,倒是 可 以 肯定 地 说 : 意象 是 神经 活动 的 独特 类 型 (或 独特 模式 、 
独特 位 置 ) 的 体验 。 显 然 , 你 心理 中 房子 的 意象 跟 组 成 意象 的 神经 事 
件 并 不 是 不 同 的 事件 ;相反 ,意象 恰恰 仅 是 这 些 神 经 事件 。 可 是 , 考 
虑 意象 时 ,我 们 通常 是 从 心理 的 角度 进行 的 ,而 不 是 从 神经 的 角度 
〈 诸 如 神经 元 及 其 定位 \ 点 火 模式 、 内 在 联系 、 发 送 器 物质 的 数量 等 ) 
进行 的 。 也 就 是 说 ,心理 层次 和 神经 层次 都 是 真实 的 ,并 且 可 以 独立 
存在 。 不 仅 如 此 ,我 们 还 可 以 在 介 于 心理 和 神经 之 间 的 认 知 层次 上 ， 
用 意象 图 式 激活 等 抽象 的 术语 (而 不 是 神经 标签 ) 来 描述 神经 系统 
经 历 的 神经 事件 。 所 谓 心 理 层次 相当 于 我 们 的 意识 或 觉 知 (con- 
sciousness or avwareness) ,这 就 是 当 你 在 思考 你 的 “心理 ?时 ,你 所 意 
指 的 。 神 经 层次 是 基于 或 多 或 少 有 关 神 经 系统 的 活动 的 文字 描述 
的 。 如 果 把 神经 系统 的 活动 描述 得 更 抽象 一 点 ,那么 我 们 就 达到 了 
认 知 层次 。 我 们 可 能 不 会 意识 到 我 们 所 有 的 认 知 和 神经 活动 ,但 是 
这 些 层 次 都 是 描述 心理 事件 的 一 种 方便 的 方式 .Q 于 是 ,在 比较 抽 
象 的 认 知 层次 上 ,意象 可 以 抽象 为 结构 化 的 图 式 , 图 式 可 以 分 解 为 结 
构成 分 及 其 构成 方式 。 这 样 , 只 要 找 出 隐喻 表达 的 构成 成 分 及 其 结 
构 关 系 跟 相应 图 式 的 构成 成 分 及 其 结构 方式 之 间 的 映射 关系 ;就 可 
以 用 产生 式 规则 (production rule) 写 出 算法 化 的 关于 隐喻 表达 的 语 
义 解 释 规 则 ,从 而 完成 从 隐喻 表达 的 认 知 解释 到 计算 分 析 的 技术 转 
变 。 

比如 ,对 于 容器 隐喻 来 说 ,其 意象 图 式 的 结构 成 分 是 一 个 边界 ， 


@ 参考 Solso (1979) 第 十 一 章 : 心 象 ,中 译本 第 307 一 331 页 。Best (1998) 第 一 章 ， 
认 知 心理 学 : 定义 .起源 和 隐喻 ,中 译本 第 6 一 7 页 ;第 六 章 第 二 节 ， 分 布 表象 中 的 有 关 概 
念 , 中 译本 第 178 一 179 页 。 
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它 把 相关 的 空间 划分 为 内 部 和 外 部 两 个 部 分 ,从 而 在 人 的 心理 上 形 
成 一 个 容器 的 构 型 。 抓 住 了 这 一 点 ,我 们 就 可 以 给 出 从 容器 隐喻 表 
达 的 句法 形式 到 语义 表达 的 形式 化 的 .并 且 经 过 调整 后 是 可 以 算法 
化 的 规则 系统 。 例 如 : 

(1) 满 桌 子 糖 果 满 屋 子 武器 ” 满 脑子 小 资 情调 

(2) 满 桌子 的 糖果 满 屋子 的 武器 ” 满 脑子 的 小 资 情调 

(3) 满 桌 子 是 糖果 满 屋子 是 武器 满 脑 子 是 小 资 情调 

(4) 桌子 上 放 满 了 糖果 屋子 里 堆 满 了 武器 脑子 里 装 满 

了 人 小资 情调 

(5) 满 大 街 溜 达 满 地 翻滚 满 世 界 找 人 借 钱 
如 果 忽 略 一 些 细节 ,那么 例 (1) 一 (3) 这 三 种 句法 形式 表达 的 意义 是 
相近 的 ;为 了 方便 ,可 以 把 这 三 种 格式 合 记 作 S1: 满 十 NP, 十 (的 /是 
十 )NP: 。 作 为 约定 ,我 们 用 “NP ”代表 NP 的 语义 所 指 (Csemantic 
referent) 。 于 是 ,运用 一 阶 谓词 逻辑 就 可 以 写 出 S1 的 如 下 语义 解释 
规则 Rla: 


让: 满 十 NP; 十 (的 /是 十 )NP:;， then: 
(人 人“NP ”is-a CONTAINER,，“NP:; ”is-aiCONTENTS; 
“NP:，is-in“ NB 7; 

ii 了 y，Vz [is-in (Crz，y)]-> 三 和 NP7 2 三 人 NPI) 
其 中 ,is-a( 属 于 ) 和 is-in( 在 ……- 上 /7 中 ) 等 是 用 以 描述 语义 的 元 语言 
(metalanguage) 中 的 谓词 ,CONTAINER( 容 器 ) 和 CONTENTS( 容 
物 ) 等 是 描述 语义 的 元 语言 中 的 概念 范畴 。 如 果 把 语 名 实例“ 满 桌子 
(的 /是 ) 糖 果 ?” 代 人 Rla, 那 么 可 以 得 出 如 下 的 语义 表达 式 Mla; 

“桌子 ?是 容器 糖果” 是 容 物 六 糖果 ”在 “桌子 ”上 ; 

存在 着 一 张 桌 子 , 所 有 的 “糖果 ”都 在 这 张 “ 桌 子 ” 上 。 
显然 , 像 Rla 这 种 语义 解释 规则 过 于 简略 ,并 不 能 完全 反映 * 满 的 
充满 意义 。 为 了 刻画 "“ 满 ?的 充满 意义 ,我 们 必须 引入 SPACE( 空 间 ) 
和 SUB-SPACE( 子 空间 ) 等 元 语义 范畴 。 于 是 ,， 满 的 意义 可 以 解 
释 为 满 ?激活 一 个 关于 容器 的 意象 图 式 ,该 容器 可 以 划分 为 若干 子 
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空间 ,每 个 子 空间 中 都 有 容 物 。 据 此 ,语义 解释 规则 Rla 可 以 扩充 
成 人 lb: 


if: 满 十 NP: 十 (的 /是 十 )NP:; then: 

{i“NP ”is-a CONTAINER， “NBP: ”is-a CONTENTS; 
“NP: ”is-in“NPi73; 

ii 本 YYzis-ip (zy 及 二 > 2 一 INP 9 NB 

iii。，CONTAINER has many SUB-SPACE，i.e. ，y 王 溯 十 
入 半 0 

iv。、Vw，3 了 3z [has (y ，z)] 一 ZNP: 7 CNP 一 
2 


如 果 把 语句 实例 “ 满 桌 子 (的 /是 ) 糖 果 ” 代 入 R1lb, 那 么 可 以 得 出 如 下 
的 语义 表达 式 Mlb: 


“桌子 ?是 容器 “糖果 ”是 容 物 玉 糖果 ”在 “桌子 > 上; 

存在 着 一 张 桌子 ,所 有 的 “糖果 ”都 在 这 张 “ 桌 子 ” 上 ; 

“ 课 子 ( 面 )” 有 许多 子 空间 “桌子 ( 面 )” 的 每 一 个 子 空间 中 

都 有 “糖果 ”。 

显然 ,Rlb 这 种 语义 解释 规则 在 逻辑 上 是 不 协调 的 。 因 为 当 我 们 从 
外 延 上 把 容器 划分 为 许多 子 空 间 时 ,也 得 从 外 延 上 把 容 物 划分 为 许 
多 子 集 ; 也 就 是 说 ,不 能 在 使 用 容器 的 外 延 意义 的 同时 使 用 容 物 的 内 
涵 意 义 。 考 虑 到 这 一 点 ,Rlb 可 以 修正 为 如 下 的 Rlc: 


这 : 满 十 NP1 十 (的 /是 十 )NP:; then: 

( 企 “NPi7 is-a CONTAINER， NBP: 1s-a COQONTIENTS; 
“NEP, ”isn INP 2 

ii 本 y，Vz [is-in (z，y)]> z 一 “ZNP:，，y 一 “NP 

ii，。CONTAINER has many SUB-SPACE，i.e. ，y 一 光 十 
2 十 …… 十 yn 

iv， CONTENTS has many SUB-CONTENTS，ie. ，Z 一 
二 

员 可 卫 [has《 大 五 河 汪 关 后 人 NB 和 作 EE NB ， 
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z 一 ]， 男 ， *…。， D} 


从 数学 的 角度 看 ,由 集合 X 到 集合 了 的 关系 尺 , 可 以 用 序 对 (z， 

y) 来 表示 ,其 中 ZEX,yEY。 所 有 有 关系 及 的 序 对 构成 一 个 尺 集 。 
在 集合 X 与 集合 中 各 取出 一 元 素 排 成 序 对 ,所 有 这 样 的 序 对 构成 
的 集合 叫做 X 和 Y 的 直 积 集 , 记 作 : 和 XY 王 {((Cz，y)|1zEX,yE 
Y}。 显 然 ,R 集 是 X 和 了 的 直 积 集 的 一 个 子 集 , 即 RCXXY。 对 
于 这 里 的 Rle 的 v 行 逻辑 式 来 说 ,关系 has 集 是 和 >y 的 直 积 集 的 
一 个 子 集 。 如 果 把 语句 实例 “ 满 桌 子 ( 的 /是 ) 糖 果 " 代 入 Rlc, 那 么 可 
以 得 出 如 下 的 语义 表达 式 Mlc: 

“桌子 "是 容器 ， 糖 果 " 是 容 物 ; 糖果 ”在 "桌子 "上 

存在 着 一 张 桌 子 , 所 有 的 “糖果 ?都 在 这 张 “ 桌 子 ” 上 ; 

“桌子 ( 面 )” 有 许多 子 空间 ， 糖 果 ” 有 许多 子 集 ; 

“康子 ( 面 ) 的 每 一 个 子 空间 中 都 有 一 些 “ 糖 果 ”。 
像 Rlc 这 种 规则 ,在 逻辑 上 还 算 差 强人 意 。 但 是 ,在 常识 和 经 验方 
面 , 可 能 会 碰 到 不 容易 自然 地 处 理 的 实例 。 比 如 , 像 “ 糖 果 ” 这 种 离散 
性 的 物质 ,划分 子 集 很 容易 ; 像 “ 汗 水 ”等 连续 性 的 物质 勉强 还 可 以 划 
分 ,因为 在 " 满 身 的 汗水 ”中 ， 脸 上 的 汗水 ”和 ”“ 背 上 的 汗水 ?是 可 以 分 
开 的 。 但 是 ,对 “歌声 ”等 连续 性 的 物质 划分 子 集 似乎 不 太 自然 。 比 
如 ， 碰 到 “ 满 剧 场 的 歌声 这样 的 表达 ,我们 能 不 能 把 “歌声 ?划分 成 几 
个 子 集 呢 ? 也 许 , 我 们 可 以 说 : 坐 在 前 排 听 到 的 歌声 和 坐 在 后 排 或 
包厢 中 听 到 的 歌声 是 不 同 的。 看 来 ,如 果 对 容 物 进 行 子 集 划 分 是 普 
遍地 可 行 的 ,那么 就 可 以 保证 Rlec 在 运用 上 的 普遍 适用 性 。 

如 果 上 述 办 法 是 可 行 的 ,那么 推广 开 来 , 例 (4) 这 种 格式 可 以 记 

作 S2: NP: 十 V 满 了 十 NP*。S2 的 语义 解释 规则 R2 可 以 表示 如 
这 


计 . NP 十 V 满 了 十 NP, ;then: 
(人 人“NPi is-a CONTAINER,，“NP; ”is-a CONTENTS; 


四 详 见 楼 世博 等 (1985) ,第 35 一 36 页 。 
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“NP，, ”is-in“NP, 

ii。、 习 >y，Vz [is-in (z，y)]-> 一“NP:，，y 一 “NPi 

iii，CONTAINER has many SUB-SPACE，i.e. ，y 一 兴 十 
0 

iv， CONTENTS has many SUB-CONTENTS，i. e. ，z 一 
元 2 

V。VWy， 习 记 [has (yi zi)] 一 去 人 <NP2 7”，y ENP7，i; 
三 2 

本 全 用 和 河 左 人 区 2 罗 天] 二 人 三 声 ， 贡 全 
“NP:”, 工 一 “NP cause(Mhas》》 


其 中 ,cause 是 描述 语义 的 元 语言 中 的 谓词 ,A 代表 施 事 论 元 (在 S2 
中 是 隐 含 不 出 现 的 ),P 代表 受 事 论 元 , 工 代表 处 所 论 元 ,“V?* 代 表 
的 语义 所 指 ,Ahas 代表 v 这 一 行 逻辑 式 。 整 个 vi 行 逻 辑 式 的 意思 
是 : A 在 `NP,”“V?”“NP: ”的 行为 使 得 “NP, "的 各 处 都 有 一 些 
“NP: ”。 如 果 把 语句 实例 “屋子 里 堆 满 了 书 ” 代 入 R: ,那么 可 以 得 出 
如 下 的 语义 表达 式 Ma : 


二 ( 某 人 ) 在 桌子 上 堆 书 的 行为 ,使 得 桌子 上 到 处 都 有 一 


相应 地 , 例 (5) 这 种 格式 可 以 记 作 S3: 满 上 NP 十 VP。S3 的 语 
义 解 释 规则 R3 可 以 表示 如 下 : 


过: 满 十 NP 十 VP; then: 

{(“NP”isra CONTAINER，“VP， is-a CONTENTS; 
“VP” is-in“NP7; 

ii。 习 y，Vz Lis-in (z，y)] 一 xx 一 4VP ，y 一 “人 NP7; 

iii，、CONTAINER has many SUB-SPACE,，i. e. ，y 一 洲 十 
加 十 十 on 
iv，、CONTENTS has many SUB-CONTENTS，i es ， 之 三 
2 

vv、 Vi， 了 站 [has (yz 一 2E2NP ECNE 
二 证 入 癌 下 
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如 果 把 语句 实例 “ 满 大 街 溜 达 ” 代 入 R3 ,那么 可 以 得 出 如 下 的 语义 表 
达 式 M3 : 


“大 街 ? 是 容器 ,溜达 ”是 容 物 六 溜达 拭 发 生 ] 在 "大街 ”上 

存在 着 一 个 “大 街 ”, 所 有 的 “溜达 ”行为 都 [发 生 ] 在 这 个 “大 
街 " 上 上 ; 

“大 街 ( 上 )” 有 许多 子 空间 ,溜达 ”行为 有 许多 子 集 ; 

“大 街 ( 上 )?” 的 每 一 个 子 空间 中 ,都 有 一 些 “ 溜 达 ” 行 为 [在 那 
儿 发 生 ] 。 


对 于 套件 隐喻 来 说 ,其 意象 图 式 的 结构 成 分 是 一 个 整体 和 若干 
个 部 分 、 一 个 体现 各 部 分 如 何 构成 整体 的 构 型 。 抓 住 了 这 一 点 ,就 可 
以 参照 上 文 对 容器 表达 的 计算 分 析 , 把 套件 的 各 部 分 看 作 是 一 个 个 
容器 ,于 是 套件 就 成 为 一 套 容器 ;相应 地 ,在 这 些 容器 中 的 容 物 也 成 
为 一 套 离散 的 容 物 。 这 样 ,就 可 以 给 出 从 套件 隐喻 表达 的 句法 形式 
到 语义 表达 的 形式 化 的 .并 且 经 过 调整 后 是 可 以 算法 化 的 规则 系统 。 
例如 : 


(6) 全 身 伤痕 ”全身 大 汗 全 单位 职工 ”全 世界 人 口 

(7) 全 身 的 伤痕 全身 的 大 汗 全 单位 的 职工 全 世界 的 
人 口 

(8) 全 身 是 伤痕 全身 是 大 汗 关 全 单位 是 职工 关 全 世 
界 是 人 口 


如 果 忽 略 一 些 细节 ,那么 例 (6) 一 (8) 这 三 种 句法 形式 表达 的 意义 是 
相近 的 ;为 了 方便 ,可 以 把 这 三 种 格式 合 记 作 S4: 全 十 NP: 十 (的 /是 
十 )NP, 。 结 合 处 理 容 器 隐喻 表达 的 办 法 ,就 可 以 写 出 S4 的 如 下 语 
义 解 释 规 则 R4: 

if: 全 十 NP, 十 (的 /是 十 )NP:; then: 

(1 和“NP, ，is-arsetrof CONTAINERS,，“NP: ”is-a-set-of 

CONTENTS;“NP:， is-in“NPi ”; 
ii。 习 yy,Vz [Lis-in ( 六 ,yy)]> Z 一 NP:”，y 一 " NP ; 
iii，CONTAINERS is-a SET consists of miany SUB-SET， 
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ie.y yy 和 二 丈 寺 驳 十 十 yw 

iv。 CONTENTS is-a SET consists of many SUB-SET， 
ie 这 王 关 十 2 十 … 村 元 5 

TY 了 于 人 和 和 INP5 六 ENP 1i 
三 本 人 去， 

Vi 和 XGzl，22 Zn) [is-in (zy 到 is-in(zzy 加 ) 取 
is-in (zy)]; 

站 二 二 


如 果 把 语句 实例 “全 单位 (的 ) 职 工 ? 代 入 R4, 那 么 可 以 得 出 如 下 的 语 
义 表 达 式 M4: 


“单位 ?是 一 套 容器 ,职工 "是 一 批 容 物 ij 职工” 在“ 单位” 
市 

存在 着 一 个 “单位 ?, 所 有 的 “职工 ?都 在 这 个 “单位 中; 

“单位 ?有 许多 子 集 ( 即 部 门 ), 职工 2 有 许多 子 集 ; 

“单位 ?的 每 一 个 子 集 ( 即 部 门 ) 中 都 有 一 个 “职工 ”的 子 集 ; 

每 一 个 子 单位 ( 即 部 门 ) 中 的 职工 子 集 的 总 和 就 是 “全 单位 
(的 ) 职 工 ”。 


虽然 R4 看 上 去 是 比较 折 绕 的 ,但 是 我 们 希望 它 能 较 好 地 抓 住 
Cecatch) “全 ”的 语义 特点 。 

最 后 应 该 指出 ,上 述 “ 满 >“ 全 ?的 语义 解释 规则 充其量 只 是 一 种 
非常 粗略 的 鼻 近 。 其 中 ,不 仅 在 逻辑 上 有 许多 技术 细节 需要 仔细 地 
推 殴 和 修正 ;而 且 , 从 经 验 上 看 ,有 许多 参数 还 需要 在 具体 的 上 下 文 
语 境 中 依靠 百科 知识 (encyclopedic knowledge) 才 能 设 定 。 比 如 ,; 语 
义 解 释 规则 Rlb 中 的 SPACE 和 SUB-SPACE ,在 “ 满 大厅 的 客人 ” 
中 应 该 是 平面 的 地 面 , 在 “ 满 大 厅 的 歌声 ”中 则 应 该 是 立体 的 空间 。 
另外 ,作为 SUB-CONTENTS， 客 人 ?是 离散 的 ,可 以 分 处 于 不 同 的 
SUB-SPACE 中 ;而 “歌声 ?可 能 是 连续 的 ,不 一 定 能 分 处 于 不 同 的 
SUB-SPACE 中 。 再 如 ,语义 解释 规则 R2 中 的 SET 和 SUB-SET， 
在 "全身 的 活水 ”中 应 该 是 人 体 和 人 体 的 各 个 外 表 部 分 (脑袋 .躯体 和 
四 肢 等 ) ,在 "全校 的 学 生 ” 中 则 应 该 是 班级 的 全 集 和 一 个 个 班级 这 种 
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子 集 。 这 些 参数 都 需要 在 具体 的 语 境 中 、 结 合 考虑 所 研究 的 计算 模 
型 的 实际 应 用 领域 和 对 象 , 来 设 定 并 逐步 加 以 调整 。 


8 认 知 解释 的 概括 性 


在 传统 的 分 布 描写 的 基础 上 ,从 认 知 的 角度 对 句子 中 词语 之 间 
的 选择 限制 关系 进行 分 析 , 可 以 获得 直观 性 很 强 的 、 统 一 而 又 简明 的 
解释 。 比 如 , 储 泽 祥 (1996) 注 意 到 

GD“ 满 一般 只 能 跟 具体 名 词 结合 ,通常 不 能 跟 抽象 名 词 结 合 
(第 340 页 ) 。 

(Gil“ 满 二 N? 后 可 以 添加 “里 、 上 ”等 方位 词 ( 如 : 满 墙 上 是 标语 、 
满堂 厅 里 是 客人 ); 而 “全 十 N?” 后 一 般 不 能 添加 方位 词 ( 第 342 页 ) 。 

Xiil“ 全 十 N? 中 的 N 必须 是 可 总 括 范围 的 名 词 , 常 要 求 N 有 一 
个 完整 的 范围 ,范围 不 确定 的 名 词 不 能 进入 (如 : < 全 地 、* 全 墙 、 
类 全 脸 、x 全 扁担 )( 第 340 页 ) 。 

CGiv)“ 全 十 N” 中 的 N 常常 是 合体 的 ,可 以 分 出 层次 或 不 同 部 分 
(如 : 省 .市 军区、 课程 .工序 ); 而 “ 满 二 N” 中 的 N 常常 是 独 体 的 ， 
难以 分 出 层次 (如 : 被 单 、 柱 子 、 脸 、 眼 )( 第 341 页 ) 。 

(Cv) 可 以 构成 “全 十 N 十 各 十 X” 格 式 , 不 能 构成 “ 满 上 二 N 十 各 十 
X2” 格 式 ( 如 : 全 国 各 地 、 全 厂 各 车 间 、* 满 城 各 处 、* 满 身 各 器 官 ) (第 
341 -页 )5 

(Cvi) 少数 “全 十 N ?格式 有 对 应 的 “ 半 十 N? 格 式 ( 如 : 全 票 一 半 
票 、 全 身 一 半身 、 全 心 全 意 一 半 心 半 意 )，“ 满 十 N?” 格 式 一 般 没有 对 应 
的 “ 半 十 N2 格 式 ( 第 341 页 ) 。 

对 于 上 述 这 些 看 似 琐碎 并 且 没 有 联系 的 观察 ,如 果 从 隐喻 表达 
及 其 意象 图 式 的 角度 进行 分 析 ,那么 可 以 分 别 作出 这 样 的 解释 : 

(GD 因为 “ 满 ” 的 意义 背后 的 概念 结构 是 一 种 容器 隐喻 ,具体 的 
事物 比较 容易 被 人 们 看 成 容器 、 抽 象 的 事物 被 人 想象 成 容器 的 难度 
较 大 ;所 以 具体 名 词 和 抽象 名 词 在 跟 * 满 ”的 结合 几率 上 是 不 均衡 的 。 
但 是 ,只 要 其 所 指 能 被 人 们 想象 成 一 个 容器 ,那么 再 抽象 的 名 词 也 能 
跟 “ 满 ?组 合 ; 比 如 :”" 满 负荷 、 满 工作 量 、 排 满 了 日 程 ”。 
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《ii) 因为 容器 表达 “ 满 十 N? 在 意义 上 涉及 空间 ,所 以 可 以 跟 方 
位 词组 合 ; 而 套件 表达 “全 十 N” 在 意义 上 不 涉及 空间 ,所 以 不 能 跟 
方位 词组 合 。 
'ii) 因为 “全 十 六 "是 一 种 套件 隐喻 表达 ,所 以 要 求 其 中 的 名 词 
必须 有 一 个 完整 的 范围 ,以 形成 一 个 由 部 分 构成 的 整体 的 构 型 。 
iv) 所 以 要 求 其 中 的 名 词 的 所 指 , 必 须 是 一 种 合体 的 、 分 层次 
的 部 件 一 整体 结构 。 
Cv) 所 以 可 以 有 “全 十 N 十 各 十 X” 这 种 总 一 分 式 表 达 。 
Cvi) 因为 套件 是 由 离散 性 的 部 件 构成 的 ,所 以 能 用 “ 半 ? 来 度 
量 ; 而 容器 是 连续 性 的 空间 ，“ 半 ?” 跟 容器 的 闭合 性 的 边界 是 不 相 容 
的 。 比 如 ,一 个 碗 是 容器 , 半 个 碗 就 不 成 其 为 容器 了 。 但 是 ,不 排除 
在 形象 性 的 表达 (figurative expression) 中 ,可 以 在 一 个 相对 天 然 的 
空间 的 正中 间 想 象 出 一 条 边界 ,从 而 创造 出 “ 半 十 N?” 这 种 表达 方式 。 
例如 : 
〈1) 满 窗 新 绿 一半 窗 新 绿 ” 满 头 白 发 一 半 头 白 发 ” 满 池 春 
水 一 半 池 秋水 
〈2) 满 圆 的 月 亮 一 半圆 的 月 亮 ”满江红 (水 ) 一 半 江 红 ( 水 ) 
《3) 一 道 残阳 铺 水 中 , 半 江 瑟瑟 半 江 红 。( 和 白居易 《 暮 江 
吟 
(4) As for a pessimist，a half full bottle of water is a half 
empty bottle of water. 
(直译 : 对 于 一 个 悲观 主义 者 来 说 , 半 满 瓶 水 是 半空 瓶 水 ; 
意译 : 对 于 一 个 悲观 主义 者 来 说 , 满 满 的 半 瓶 水 是 空空 的 半 瓶 
水 ) 
可 见 , 认 知 分 析 不 仅 可 以 解释 正确 的 观察 ,还 能 倒 过 来 校正 不 完 
全 正确 的 观察 。 


鸣谢 : 本 文 第 五 节 对 于 有 关 汉 字 的 字形 和 字义 分 析 , 得 到 了 同 
事 沈 培 先生 的 指正 ;第 七 节 对 于 “ 满 十 NP 十 …? 和 “全 十 NP 十 …” 等 
语言 表达 的 语义 解释 规则 的 构造 和 形式 表示 ,得 到 了 同事 麻 卫 东 先 
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生 的 指正 。 说 此 一 并 致 以 诚挚 的 谢意 。 当 然 , 如 有 什么 差错 ,责任 全 
在 作者 本 人 。 
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关于 分 词 规范 和 规范 词 表 的 
若干 意见 


本 文 简单 地 讨论 分 词 时 碰 到 的 判定 困难 和 表示 困难 ,指出 分 词 规范 
应 该 尽 可 能 地 利用 规则 来 说 明 分 词 单位 的 确定 原则 。 最 后 ,建议 规范 词 
表 应 该 设立 五 个 不 同 的 等 级 ,以 便 不 同 的 用 户 既 可 以 各 取 所 需 , 又 可 以 互 
相 折 算 和 对 应 。 


1 分 词 困难 的 两 种 类 型 


大 家 都 认识 到 ,对 现代 汉语 真实 文本 进行 分 词 会 碰 到 许多 困难 。 
就 笔者 的 体会 是 ,这 些 困 难 中 有 两 点 比较 突出 。 下 面 , 我 们 作 简 单 的 
论 列 。 


1.1 判断 上 的 困难 


对 于 结构 类 型 相同 、 结 构 项 的 语法 属性 相同 的 字 串 ,哪些 是 词 、 
哪些 不 是 ,不 易 断 定 。 例 如 : 


鸡蛋 一 野鸡 蛋 ”猪肉 ~ 病 猪 内 “排球 赛 ~ 沙滩 排球 赛 


承认 前 者 是 词 ,大概 没有 问题 ;说 后 者 也 是 词 ,就 会 引起 争议 。 但 是 ， 
为 什么 跟前 者 严格 同 构 的 后 者 就 不 是 词 了 呢 ? 可 能 不 容易 说 出 一 个 
令 人 信服 的 理由 来 。 也 就 是 说 ,很 难 给 出 一 个 严格 的 词 的 定义 ,这 使 
得 分 词 在 实际 操作 上 会 碰 到 许多 见仁见智 的 分 歧 。 


1.2 表示 上 的 困难 


有 时 候 , 我 们 能 正确 判断 哪些 字 串 是 词 . 哪 些 不 是 ,并 且 不 同 的 
学 者 之 间 都 有 共识 ;但 是 ,不 易 揭示 这 种 判断 背后 的 知识 。 也 就 是 
说 ,不 容易 找到 和 说 出 判断 词 的 标准 ,难于 把 词 的 定义 和 判定 标准 表 
示 得 明确 无 误 。 例 如 : 
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牛肉 一 马 肉 一 驴子 肉 一 长 颈 放 肉 

订 书 机 一 运 煤 车 一 违章 车 牵引 车 
和 赁 感觉 ,我 们 可 以 断定 这 里 的 “牛肉 ` 订 书 机 ”肯定 是 词 ， 马 肉 、 运 煤 
车 ”就 不 像 是 词 ,而 “驴子 肉 ,长 须 谭 肉 ” 和 “违章 车 牵引 车 ”就 更 不 像 
是 词 了 。 问 题 是 ,怎样 把 我 们 的 这 种 语感 表示 成 明确 的 语言 学 知识 。 


2 分 词 规范 中 应 该 利用 规则 
《信息 处 理 用 现代 汉语 分 词 规范 》8$ 5. 1. 2. 2 中 指出 : 民族 名 、 


只 有 两 个 字 的 民族 名 \ 地 名 ，, 则 不 予 切 分 。 例 如 : 
汉族 一 哈萨克 ( 族 ) 忻 县 ~ 正定 (县 ) 
专 名 部 分 不 能 单独 存在 而 保持 原 有 意义 的 地 名 ,不 予 切 分 。 例 如 
牡丹 江 横断 山 
街路 .村 镇 名 称 , 各 大 洋 和 大 海 一 律 为 分 词 单位 。 例 如 
长 安 街 大 西洋 ”地中海 
我 们 觉得 , 上面 这 些 规 定 , 如 果 用 规则 说 起 来 ,可 能 会 更 简单 和 明了 。 
比如 : 


如 果 “ 专 名 十 类 名 ”能 省 略为 “ 专 名 ”那么 单独 切 分 ,否则 不 
也 声 闸 ? 


3 规范 词 表 应 该 建立 等 级 


一 个 通用 的 兼顾 人 机 的 规范 词 表 应 该 设立 等 级 类 别 , 以 便 不 同 
的 用 户 既 可 以 各 取 所 需 , 又 可 以 互相 折算 和 对 应 。 比 如 ,一 级 词汇 是 
那些 没有 争议 的 词 ,二 级 词汇 是 那些 游 移 于 词 和 词组 之 间 的 字 串 , 它 
们 通常 由 一 些 能 产 性 强 的 格式 或 结合 面 宽 的 语素 造成 。 例 如 : 


关于 分 词 规范 和 规范 词 表 的 若干 意见 377 


好 吃 好 型 公开 化 地 下 化 游戏 机 抽 油 烟 机 
三 级 词汇 是 那些 在 现代 汉语 中 并 不 通用 的 文言 词 ,他们 通常 出 现在 
固定 的 文体 或 结构 中 。 例 如 

讯 ( 如 “新 华 社 某 月 某 日 讯 >) 

总 ( 如 "这样 的 事 他 也 这 而 不 做 ?) 
四 级 词汇 是 那些 从 语言 学 上 看 肯定 是 词组 ,但 同 现 概率 和 出 现 频率 
极 高 的 字 串 。 例 如 : 


一 个 这 种 那些 不 同 为 什么 百分之百 


为 了 信息 处 理 的 方便 ,可 以 把 它们 当 作 是 一 个 分 词 单位 。 也 可 以 模 
仿 语音 词 和 语法 词 的 区 分 , 称 之 为 “工程 词 。 

而 对 于 一 些 用 于 汉字 输入 的 词 库 , 像 下 面 这 些 跨 越 语 法 结构 层 
次 常见 的 字 串 ,也 可 以 作为 一 个 分 词 单 位 而 收入 。 例 如 : 


这 是 “ 那 是 不 是 不 像 很 不 不 太 也 是 都 是 


这 些 字 串 的 出 现 频率 是 很 高 的 ,作为 一 个 分 词 单位 ,为 输入 提供 了 便 
利 。 为 了 区 别 , 可 以 称 之 为 “输入 词 ”。 也 可 以 把 这 种 “输入 词 " 作 为 
词 库 中 的 五 级 词汇 。 

如 果 有 了 类 似 的 分 级 词 表 , 那 么 不 同 的 用 户 可 以 根据 需要 来 规 
定 把 哪 几 级 词汇 作为 分 词 单位 。 这 也 许 是 达到 共享 和 复 用 电子 词典 
和 语料库 等 语言 资源 的 一 种 现实 的 措施 。 


1997 年 2 月 初稿 ,3 月 改定 
(发 表 于 《语言 文字 应 用 》1997 年 第 4 期 ) 
2004 年 9 月 修改 
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本 文 是 笔者 1998 一 1999 年 为 《语言 文字 应 用 》 主 持 “ 中 文 信息 处 理 中 
的 语言 难题 征 问 征 答 ” 期 间 , 写 的 一 则 缘起 、. 四 则 答 问 和 收集 ` 整 理 的 两 组 
问题 。 承 张 伯 江 先生 奉 奖 这 个 栏目 为 “打开 《语言 文字 应 用 》 时 ， 觉 得 这 是 
一 个 亮点 ”。 因 此 ，, 教 沉 自 珍 , 也 收入 这 个 文集 中 。 


缘 起 


由 于 工作 关系 ,我 们 经 常 跟 计算 机 界 从 事 中 文 信息 处 理 的 人 士 
打交道 ,也 经 常 被 他 们 问 起 一 些 语言 事实 及 其 相关 的 分 析 方 法 等 方 
面 的 问题 。 其 中 ,有 不 少 问题 不 仅 对 中 文 信息 处 理工 作 是 重要 的 ,而 
且 对 语法 理论 的 更 新 和 分 析 技 术 的 改进 也 有 重要 的 启发 意义 。 因 
此 ,我 们 假 ( 语 言 文字 应 用 》 这 个 宝贵 的 园地 ,开设 中 文 信息 处 理 中 的 
难题 征集 和 征 答 这 一 栏目 , 供 中 文 信息 处 理 界 的 朋友 能 够 尽情 地 提 
出 自己 在 工作 中 磁 到 的 语言 难题 ,同时 希望 语言 学 界 的 人 士 能 够 中 
妈 应 答 和 提出 各 种 解决 方案 。 我 们 热忱 地 希望 这 个 栏目 能 够 成 为 沟 
通信 息 学 界 和 语言 学 界 的 一 座 小 小 的 桥梁 ,通过 相互 问 难 和 辩 驭 来 
加 强 交 流 增进 了 解 , 共 同 为 推动 中 文 信息 处 理事 业 和 汉语 语言 学 的 
向 前 发 展 作 出 贡献 。 


1 “时 间 词 十 时 间 词 ”的 结构 歧义 


问 : 短语 “今天 春节 ”和 ”今年 春节 ?在 词类 序列 上 都 是 "时 间 词 

十 时 间 词 >, 但 结构 关系 不 同 : 前 者 是 主 谓 结构 ,后 者 是 偏 正 结构 。 
有 没有 适当 的 语法 规则 ,可 以 据 此 把 它们 区 别 开 来 ? 

(北京 大 学 人 金 茂 兵 问 ) 

答 : 为 了 区 别 “ 时 间 词 十 时 间 词 ?的 结构 类 型 ,必须 对 时 间 词 进 
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行 精细 的 次 范畴 化 分 类 。 大 体 上 说 “时 间 词 十 时 间 词 ?序列 ( 记 作 : 
T1 十 T2) 可 以 构成 三 种 句法 结构 : (1) 并 列 结构 ,如 :“ 过 去 、 现 在 | 星 
期 一 .星期 二 | 清明 、 谷 雨 ";(2) 主 谓 结构 ,如 :“ 明 天 (( 不 ) 是 ) 中 秋 | 
今天 (( 不 ) 是 ) 星 期 三 >; (3) 偏 正 结构 , 如 :去 年 夏天 | 本 月 18 号 ”。 
显然 地 ,这 三 种 结构 对 进入 T1 和 T2 位 置 上 的 时 间 词 的 小 类 有 严格 
的 选择 限制 。 粗 略 地 说 ,并 列 结构 要 求 TI1 和 工 2 位 置 上 的 时 间 词 属 
于 同一 种 名 法、 语义 小 类 ,但 语义 所 指 一 定 不 同 。 主 谓 结构 和 偏 正 结 
构 要 求 TI1 和 T2 位 置 上 的 时 间 词 一 定 属于 不 同 的 句法 .语义 小 类 ， 
出 现在 Tl 位 置 上 的 通常 是 “今天 、 明 年 ?等 相对 时 间 词 ,它们 的 所 指 
只 有 参照 说 话 的 时 间 才 能 确定 ;出 现在 T2 位 置 上 的 通常 是 “星期 
一 \ 元 旦 .18 号 ?等 绝对 时 间 词 ,它们 的 所 指 必 须 参照 上 文 话语 中 所 
涉及 的 时 间 , 比如 “星期 一 ”的 所 指 依赖 于 某 个 周 。 此 外 , 主 谓 结 构 要 
求 T1 和 T2 位 置 上 的 时 间 词 的 所 指 在 量 级 上 是 相同 的 ,比如 “今年 
闽 年 ?都 是 论 年 “今天 儿童 节 ” 都 是 论 天 。 偏 正 结构 的 工 1 一 定 在 量 
级 上 大 于 T2 ,比如 "今年 冬天 ”,T1 论 年 .T2 论 季 。 

(北京 大 学 ” 袁 钥 林 答 ) 


2 “NP1 十 VP 十 的 十 NP22” 的 层次 切 分 


问 “我们 学 校 获奖 的 学 生 ? 和 ?我们 学 校 选送 的 学 生 ? 在 词类 序 
列 上 都 是 : NP1 十 VP 十 的 十 NP2 ,但 它们 的 层次 构造 很 不 相同 。 有 
没有 简明 的 语法 规则 , 据 此 能 够 清楚 地 分 化 这 种 层次 歧义 ? 

(清华 大 学 周明 问 ) 

答 : 为 了 分 化 词类 序列 NP1 十 VP 十 的 十 NP2 的 层次 歧义 ,必须 
对 名 词 和 动词 的 次 范畴 (特别 是 个 别 动词 和 名 词 的 配 价 能 力 ) 进 行 细 
致 的 研究 。 就 有 限 范围 内 的 例子 来 说 , 当 其 中 的 VP 是 一 价 的 `NP1 
是 “学 生 .教师 ”等 零 价 名 词 时 ,NP1 是 整个 结构 的 修饰 语 “VP 十 的 ” 
是 NP2 的 修饰 语 `NP2 是 VP 的 配 价 成 分 (它们 有 潜在 的 主 谓 关 
系 ); 当 其 中 的 NP2 是 “说 法 .消息 ?等 有 价 名 词 时 ,NP1 十 VP 有 可 能 
是 主 谓 结 构 , 它 在 语义 上 充当 有 价 名 词 NP2 的 配 价 成 分 ,在 结构 上 
通过 “的 ?而 成 为 名 词性 的 定语 ,例如 "我们 学校 获奖 的 消息 (不 可 
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信 )”。 当 其 中 的 VP 是 二 价 的 .NP1 和 NP2 都 是 零 价 名 词 时 ,这 两 
个 NP 有 可 能 都 是 VP 的 配 价 成 分 ;底层 的 谓词 性 结构 “我 们 学 校 选 
送 学 生 ” 通 过 名 词 化 标记 “的 ”提取 宾语 而 变 成 偏 正 结构 “我 们 学 校 选 
送 的 学 生 ”。 

(北京 大 学 ” 袁 入 林 ， 答 ) 


3 ”信息 处 理 能 不 能 抛 开 主 语 .宾语 等 概念 ? 


问 : 印 欧 语 的 主语 和 宾语 都 是 有 形态 标记 的 ,汉语 没有 形态 变 
化 ,主语 和 宾语 等 概念 是 怎样 得 出 来 的 ? 在 中 文 信息 处 理 中 ,彻底 抛 
开 主 语 、 宾 语 等 概念 有 没有 可 能 ? 
(中国 中 文 信息 学 会 ” 董 振东 “ 问 ) 
答 : 我 们 先 来 考察 下 列 词组 ,看 看 能 不 能 从 结构 上 把 它们 归并 
为 有 限 的 几 组 : 


1 A 十 B 2. CT 二 D 

a。 小 王 | 知道 i， 造 | 桥 

b. 树叶 | 黄 了 j. 买 | 菜 

c. 价格 | 不 焉 k. 坐 | 火车 

d. 今天 | 星期 一 ]. 晒 | 太 阳 

e。 衣服 | 晒 干 了 m。 吃 | 馆子 

f. 大 刀 | 牙 钝 了 n。 喜欢 | 闲聊 

g. 什么 | 都 不 吃 o。 买 了 | 不 老少 
h. 前 面 | 是 条 河 p. 来 了 | 几 个 朋友 


上 面 这些 词 组 都 可 以 分 解 为 两 个 直接 构成 成 分 ,并 且 这 两 个 直接 成 
分 之 间 有 某 种 结构 关系 。 语 感 告诉 我 们 ,ar-h 在 结构 关系 上 比较 相 
近 ,ip 在 结构 关系 上 比较 相近 。 为 了 方便 ,我 们 可 以 把 ah 一 类 词 
组 所 具有 的 结构 关系 叫做 主 谓 关系 、 并 把 这 类 词组 叫做 主 谓 结构 ; 当 
然 ,我们 也 可 以 任意 地 分 别 叫 它们 为 入 关系 入 -结构 。 同 理 , 我 们 
可 以 把 ip 一 类 词组 所 具有 的 结构 关系 叫做 述 宾 关系 .并 把 这 类 词 
组 叫做 述 宾 结构 ;当然 ,我 们 也 可 以 任意 地 分 别 叫 它们 为 Y 关 系 和 
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Y- 结 构 。 相 应 地 ,我们 可 以 把 主 谓 结 构 的 前 项 叫做 主语 .后 项 叫做 
谓语 ;当然 ,我 们 也 可 以 任意 地 分 别 叫 它 们 为 X-1 成 分 和 X-2 成 分 。 
同 理 , 我 们 可 以 把 述 宾 结 构 的 前 项 叫做 述 语 、 后 项 叫做 宾语 ;当然 ,我 
们 也 可 以 任意 地 分 别 叫 它 们 为 Y 1 成 分 和 Y-2 成 分 。 

可 见 , 主 语 、 宾 语 只 是 一 种 方便 的 称呼 ,把 它们 叫做 什么 并 不 重 
要 ;重要 的 是 要 认识 到 : 句法 结构 是 一 种 关系 结构 ,其 各 构成 成 分 是 
受 这 种 关系 控制 的 关系 项 。 因 此 ,一 般 的 语法 著作 上 把 主语 、 宾 语 叫 
做 语法 功能 项 , 那 意思 就 是 它们 在 某 种 结构 关系 中 扮演 了 什么 角色 。 
基于 上 述 考量 ,我 相信 语法 研究 或 者 中 文 信息 处 理 ( 特 别 是 句 处 理 ) 
可 以 抛 开 主 语 、 宾 语 等 名 称 ; 但 是 ,必须 有 X- 关 系 和 X- 结 构 、Y- 关 系 
和 Y- 结 构 、X-1 成 分 和 X-2 成 分 、.Y-1 成 分 和 Y-2 成 分 等 概念 ,以 及 
相应 的 简称 或 代号 。 

这 样 说 来 ,主语 宾语 等 句法 成 分 是 从 句法 结构 关系 中 确定 的 。 
比如 ,主语 是 主 谓 结构 的 前 项 ,宾语 是 述 宾 结 构 的 后 项 。 而 句法 结构 
关系 又 可 以 通过 相应 的 变换 式 系列 来 确定 。 比 如 , 主 谓 结构 的 前 项 
和 后 项 之 间 可 以 插入 “ 呢 ? 等 语气 词 . 插 和 人 “是 不 是 ”构成 问 句 ,后 项 中 
的 动词 可 以 构成 "V 不 V? 形 式 ; 述 宾 结 构 的 前 项 和 后 项 之 间 可 以 插 
入 着 .了 .过 ?等 时 态 助 词 ,前 项 中 的 动词 可 以 构成 <V 不 V" 形 式 , 整 
个 述 宾 结构 前 可 以 受 “ 不 等 否定 词 的 修饰 。 可 见 ,主语 、 宾 语 等 概念 
不 仅 是 可 把 握 的 ,而 且 是 不 可 或 缺 的 。 例 如 : 


3. NV 十 N 4.VP 的 十 NP SRV 二 来/ 志 本 也 


出 租 汽车 . 我 买 的 梨 拿 来 了 
进口 设备 他 送 的 书 送 来 了 
研究 方法 她 写 的 诗 寄 去 了 
学 习 文 件 和 葡 烙 的 饼 买 去 了 


对 于 这 种 在 显 性 的 语法 关系 方面 有 歧义 的 结构 ,用 主语 ,宾语 ` 谓 语 、 
补 语 等 概念 来 描写 和 说 明 是 十 分 方便 的 。 比 如 ,说 例 3 既 可 以 是 述 宾 
结构 、 又 可 以 是 偏 正 结构 ,其 中 的 名 动词 NV 既 可 以 是 述 语 又 可 以 是 
定语 名词 N 既 可 以 是 宾语 又 可 以 是 中 心 语 ;说 例 4 既 可 以 是 体 词性 
的 偏 正 结构 、 又 可 以 是 主 谓 结构 (中 间 省 去 “是 ” ,其 中 的 “VP 的 ” 既 可 
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以 是 定语 又 可 以 是 主语 .NP 既 可 以 是 中 心 语 又 可 以 是 谓语 。 
(北京 大 学 “ 袁 锥 林 答 ) 


4 名 型 分 析 和 意义 分 析 


间 : 一 般 的 语法 书 上 说 “我 们 下 午 开会 一 下 午 我 们 开会 .衣服 
妈妈 洗 了 一 妈妈 衣服 洗 了 、 这 间 屋 子 我 们 堆 东 西 一 我 们 这 间 屋 子 
堆 东 西 ” 等 都 是 主 谓 谓语 句 。 事 实 上 ,这 里 的 大 主语 和 小 主语 分 别 是 
施 事 . 时 间 . 受 事 、. 工 具 等 ;既然 如 此 ,设立 主 谓 谓语 句 这 类 名 型 到 底 
有 什么 意义 ? 

(北京 语言 文化 大 学 语言 信息 处 理 研究 所 孙 宏 林 问 ) 

答 : 像 主 谓 句 、 非 主 谓 句 、 主 谓 谓语 句 等 都 是 句 型 的 名 称 。 所 谓 
句 型 就 是 句子 的 结构 类 型 ,具有 相同 的 结构 模式 的 句子 归 在 同一 种 
句 型 之 中 ; 反 过 来 说 ,属于 同一 种 名 型 的 句子 具有 相同 的 结构 模式 。 
例如 : 


A B C 

行 ! (我 ) 就 来 。 我 们 开会 了 。 
是 我 。 (她 ) 比 你 胖 。 妈妈 洗衣 服 呢 。 
起 雾 了 。 (我 ) 不 想 去 。 这 个 人 太 认 真 。 


热 死 我 了 。 (你 ) 等 一 会 儿 ! 衣服 洗 和 干净 了 。 


对 比 上 例 中 的 A、C 两 组 ,可 以 看 出 : 从 构造 方式 上 看 ,C 组 的 例子 
都 是 主 谓 结构 ,其 中 主语 和 谓语 之 间 可 以 有 一 个 句 中 停顿 ,在 这 个 停 
顿 处 可 以 加 上 “ 呢 、. 吧 、 啊 ”等 语气 词 , 还 可 以 在 主语 和 谓语 之 间 加 上 
“是 不 是 ?来 构成 问 多 …… , 正 是 这 种 结构 上 的 共性 使 我 们 能 判定 它 
们 都 是 主 谓 名 ;而 A 组 的 例子 有 相当 于 C 组 例子 中 的 谓语 这 种 陈述 
性 成 分 ,但 缺少 相当 于 C 组 例子 中 的 主语 这 种 被 陈述 的 成 分 ,因此 
称 为 无 主 句 或 非 主 谓 句 。B 组 又 跟 A 组 不 同 ,A 组 的 例句 都 是 自足 
的 句子 ,其 中 补 不 出 主语 来 ;而 B 组 虽然 没有 出 现 主 语 ,但 是 这 个 主 
语 在 具体 语 境 中 是 可 以 明确 地 补 出 来 的 ,所 以 是 省 略 了 主语 的 主 谓 
句 。 
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特别 要 注意 的 是 , 主 谓 谓语 句 是 主 谓 句 下 面 的 一 个 小 类 ,其 特点 
是 谓语 部 分 本 身 是 一 个 主 谓 结 构 。 不 管 是 主 谓 句 还 是 主 谓 谓 语句 ， 
作为 句 型 ,它们 只 反映 句子 的 第 一 或 第 二 层次 上 的 直接 成 分 之 间 的 
结构 关系 ,而 不 反映 这 些 直接 成 分 之 间 的 语义 关系 。 因 此 , 主 谓 谓语 
句 的 大 主语 可 以 是 施 事 、. 时 间 、 受 事 . 工 具 等 语义 格 , 主 谓 谓语 句 的 小 
主语 也 可 以 是 施 事 时间 、 受 事 . 工 具 等 语义 格 , 甚 至 主 谓 句 或 主 谓 谓 
语句 的 谓语 中 的 动词 的 宾语 也 可 以 是 施 事 . 时 间 、 受 事 . 工 具 等 语义 
格 。 例 如 ; 


D 下 
(1) 我 们 窗户 糊 了 报纸 了 他 们 汽车 盖 了 雨 布 了 
(2) 窗户 我 们 糊 了 报纸 了 汽车 他 们 盖 了 雨 布 了 
(3) 我 们 报纸 糊 了 窗户 了 他 们 雨 布 盖 了 汽车 了 
(4) 报纸 我 们 糊 了 窗户 了 雨 布 他 们 盖 了 汽车 了 


更 明白 地 说 ,句法 结构 的 构成 成 分 之 间 的 句法 结构 关系 是 一 回 
事 ,句法 结构 的 构成 成 分 之 间 的 语义 结构 关系 是 另 一 回 事 ,主语 、 宾 
语 等 句法 成 分 跟 施 事 、 受 事 等 语义 成 分 之 间 的 配 位 关系 (或 论 元 选择 
关系 ,argument selection) 则 又 是 一 回 事 。 语 法 研究 ,不 管 是 纯 理 论 
的 探索 还 是 面向 应 用 的 研究 ,都 需要 搞 清 楚 从 属于 同一 个 动词 的 各 
个 论 元 的 同 现 限 制 关 系 和 它们 在 句法 结构 中 的 位 置 和 顺序 。 而 要 想 
清楚 地 描写 和 说 明 论 元 结构 ,句法 结构 及 其 类 型 又 是 一 种 必 不 可 少 
的 参照 框架 。 拿 D.E 这 类 例子 来 说 ,我 们 可 以 这 样 来 说 明 动 词 “ 糊 ” 
和 “ 盖 ” 的 论 元 选择 及 其 句法 配置 : 它们 至 少 能 支配 施 事 ` 受 事 . 材 料 
三 个 语义 格 , 并 且 这 三 个 语义 格 可 以 在 同一 个 句法 结构 中 共 现 ,这 三 
个 语义 格 可 以 分 别 作 主 谓 谓 语句 的 大 主语 .小 主语 和 谓语 中 的 动词 
的 宾语 esiaee 时 

可 见 , 名 型 研究 这 种 对 句子 结构 的 类 型 分 析 ,为 研究 句法 成 分 之 
间 的 语义 关系 提供 了 描写 框架 和 理论 准备 。 但 是 ,希望 从 名 型 上 反 
映 出 句法 结构 的 语义 关系 方面 的 信息 是 不 合理 的 ,除非 在 纯粹 反映 
句法 关系 的 句 型 描写 上 附加 语义 信息 ;比如 ,说 D, 刁 中 的 (1) 是 施 事 
作 大 主语 、 受 事 作 小 主语 的 主 谓 谓 语句 ,(4) 是 材料 作 大 主语 、 施 事 作 
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小 主语 的 主 谓 谓语 句 。 如 果 是 这 样 ,那么 已 经 是 在 句 型 分 析 的 基础 
上 进行 语义 分 析 了 。 
〈 北 京 大 学 ” 袁 钥 林 答 ) 


附录 


问题 征 答 (]1) 


1. 在 “今天 有 十 > 和 “今天 星期 天 ”中 ,两 个 “今天 ”在 词性 上 是 和 否 
一 致 ? 它们 的 语法 (成 分 ) 功 能 是 否 一 样 ? 所 表示 的 语法 意义 是 否 相 
同 ? 是 怎样 得 出 是 或 否 这 种 结论 的 ? 

2. 像 “ 那 家 公司 是 去 年 成 立 的 ”一 类 句子 在 结构 上 该 如 何 分 
析 ? 

3. 对 于 “大 权 掌 握 在 总 统 手 里 ”一 类 句子 ,有 人 说 其 中 的 “大 权 ” 
是 受 事 主语 。 问 题 是 我 们 是 根据 什么 标准 来 作出 这 种 判断 的 ? 

4. 一 个 美国 学 者 问 : 在 中 国有 没有 一 种 公认 的 汉语 句法 结构 
的 描述 体系 和 方法 ,比如 像 S- NP 二 VP 等 的 产生 式 规则 及 相应 的 
句法 分 析 树 ? 

5. 汉语 兼 类 词 的 类 型 有 哪 几 种 ? 有 没有 区 分 兼 类 词 的 形式 化 
条 件 ? 

6. 表示 汉语 名 词 复数 的 显 性 和 隐 性 标志 有 哪些 ? 

7. 当 句 子 中 有 多 个 VP 时 ,作为 中 心 的 VP 的 判定 条 件 是 什 


8. 汉语 表示 被 动 意义 的 词汇 句法、 或 上 下 文 标 志 有 哪些 ? 

9. 汉语 名 词 短 语 NP 到 底 有 哪些 类 型 ? 

10. 英语 的 时 (tense) 及 体 (aspect) 在 汉语 的 译文 中 有 哪些 相应 
的 表达 方式 ? 

以 上 问题 1) 一 (4) 由 中 国 中 文 信息 学 会 董 振东 先生 提供 ,(5) 一 
(10) 由 国家 语 委 汉 志 伟 先 生 提 供 , 并 经 喜 钞 林 先 生 归 纳 整 理 。 欢 迎 
大 家 针对 问题 作出 简明 扼要 的 回答 ,对 每 个 问题 的 讨论 请 限制 在 
2000 字 以 肉 。 同 时 ,欢迎 从 事 中 文 信息 处 理 的 人 士 把 自己 在 工作 碰 
到 的 语言 难题 整理 出 来 .并 尽快 寄 到 编辑 部 来 。 让 我 们 携 起 手 来 , 共 
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同 办 好 这 一 栏目 。 
问题 征 答 (2) 


1.《 现 代 汉 语词 典 》 对 *“ 打 老虎 、. 打 归 子 . 打 苍 蜗 ? 中 的 动词 “ 打 ” 
没 给 出 明确 的 杰 义 ,也 没 对 “ 打 十 名 词 ? 这 一 结构 中 的 名 词 作出 任何 
语义 限制 。 如 果 让 计算 机 生成 这 类 短语 ,如 何 去 防 止 其 说 出 “ 打 臭 
虫 . 打 马蜂 、 打 土 丈 一 类 组 合 ? 

2.《 现 代 汉 语词 典 ? 对 动词 “ 洗 ? 的 释义 是 “用 水 或 汽油 、 煤 油 等 
去 掉 物 体 上 面 的 脏 东西 : 一 脸 | 干 一 | 一 衣服 。? 计 算 机 要 想 学 会 “ 洗 ” 
的 这 个 用 法 ,就 必须 弄 明 白 上 述 杰 义 中 谈 及 的 “物体 ?可 以 是 哪些 物 
体 ` 有 没有 什么 限制 。 为 什么 可 以 说 “洗衣 服 、 洗 车 洗钱、 洗 碗 ”, 但 
不 能 说 “ 洗 玻璃 . 洗 墙壁 . 洗 书 本 、 洗 马路 ? 

3.“ 北 京 烤鸭 店 ” 中 的 “北京 烤鸭 ,根据 语感 似乎 不 能 理解 为 
“ 烤 北 京 鸭 ?或 “北京 的 烤鸭 ”, 应 该 怎样 分 析 其 结构 并 给 出 正确 的 语 
义 解释 ? 

4.“ 童 子 烤 鸡 店 ? 既 可 以 理解 为 “ 烤 十 童子 鸡 十 店 ”, 又 可 以 理解 
为 “童子 十 烤 十 鸡 十 店 ”。 在 后 一 种 情况 下 ,童子 ” 既 可 以 理解 为 烤 
鸡 的 人 ,又 可 以 理解 为 店名 。 对 其 实际 意义 应 该 如 何 给 予 解释 ? 

5. 对 于 “我 想 去 买点 儿 东 西 ,然后 回 家 看 书 ” 这 个 句子 ,能 否 确 
定 其 中 的 各 个 成 分 (包括 各 动词 ) 之 间 的 逻辑 语义 关系 、 并 说 明 各 成 
分 在 说 话 人 的 大 脑 中 出 现 的 先后 顺序 ? 怎样 来 确定 这 个 句子 中 有 没 
有 省 略 了 什么 成 分 ? 

6. 在 自然 语言 处 理 中 ,我 们 经 常 要 用 到 语义 特征 去 表达 句子 的 
某 些 特殊 的 语法 意义 ;为 了 保证 这 种 表达 的 可 计算 性 ,要 求 每 个 语义 
特征 有 确切 的 定义 、 各 个 语义 特征 之 间 有 明确 的 关系 。 但 是 ,在 研究 
汉语 语法 的 论文 中 ,人 们 常常 是 从 不 同 的 角度 来 选取 语义 特征 的 。 
以 动词 为 例 , 从 动作 主体 上 ,有 [ 述 人 ]\.[ 非 述 人 ][ 可 控 ].[ 非 可 控 ]、 
[自主 ]\[ 非 自主 ] 等 ;从 时 间 上 ,有 [完成 ].[ 持 续 ] 等 ,从 词汇 意义 上 ， 
有 [动作 ][ 变 化 ] [位 移 ].[ 取 得 ] [给予 ][ 制 作 ].[ 附 着 ].[ 取 除 ]、 
[破损 ] [致使 ] [感受 ] [状态 ] 等 。 这 些 语 义 特征 之 间 有 什么 关系 ? 
能 不 能 把 它们 汇 成 一 个 有 序 的 集合 ? 
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以 上 问题 (1) 一 (5) 由 中 国 社会 科学 院 语言 研究 所 杨 国 文 先生 提 
供 ,(6) 由 中 国 社会 科学 院 语言 研究 所 传 爱 平 先生 提供 ,并 经 喜 笠 林 
先生 归纳 整理 。 欢 迎 大 家 针对 问题 作出 简明 扼要 的 回答 ,对 每 个 问 
题 的 讨论 请 限制 在 2000 字 以 内 。 同 时 ,欢迎 从 事 中 文 信息 处 理 的 人 
士 把 自己 在 工作 碰 到 的 语言 难题 整理 出 来 ,并 尽快 寄 到 编辑 部 来 。 
让 我 们 携 起 手 来 ,共同 办 好 这 一 栏目 。 


(发 表 于 《语言 文字 应 用 》1998 年 第 3、.4 期 ) 


本 文 从 语言 学 角度 ,分 析 语 言 交际 的 时 空 局 限 和 怎样 用 符号 和 技术 
手段 来 突破 这 种 限制 ,涉及 到 文字 、 书 信 、\ 电 话 、 电报、 录音 电话 、 传 真 、 移 
动 电话 ( 手 机 )、\ 电 子 邮 件 和 手机 短信 等 交际 工具 或 手段 。 特 别 是 建议 设 
计 录 音 手机 以 推动 缓冲 式 移动 通信 ,最 后 着 重 讨论 了 几 种 打破 手机 短信 
的 汉字 输入 瓶颈 的 方案 。 


1 用 文字 符号 突破 语言 交际 的 时 空 限制 


人 类 发 明了 语言 ,用 以 交流 思想 和 协调 行动 ,并 组 成 足以 主 宁 自 
然 界 的 社会 群体 。 这 段 历史 ,最 保守 的 估计 也 有 几 十 万 年 。 但 是 , 语 
言 作为 一 种 以 声音 为 媒介 、 诉 诸 听觉 的 交际 系统 ,在 使 用 上 存在 着 时 
间 和 空间 两 大 限制 ; 即 在 时 间 上 必须 是 同时 性 的 听 和 说 的 轮 替 和 反 
馈 , 在 空间 上 必须 是 同 地 性 的 ` 让 耳 共 的 听觉 够 得 着 的 。 这 种 时 空 限 
制 使 得 异 时 .异地 的 人 们 无 法 用 语言 来 进行 交际 。 为 了 克服 这 种 时 
空 限制 ,人 们 又 发 明了 文字 来 记录 稍 纵 即 逝 的 语言 ,并 形成 了 跟 口头 
语言 不 完全 相同 的 书面 语言 。 这 种 使 用 文字 的 历史 ,最 大 胆 的 估计 
也 不 会 超过 一 万 年 。 

有 了 文字 ,大 到 祖宗 的 事迹 和 先 圣 的 哲 语 可 以 垂 示 后 人 ,远方 的 
民情 和 边疆 的 战况 可 以 用 文书 来 呈报 朝廷 ;小 到 买卖 或 租赁 双方 可 
以 签订 契约 ,长 辈 在 临终 前 可 以 立 下 遗嘱 ,指示 子女 们 该 怎样 来 分 割 
遗产 。 在 民间 ,书信 往来 成 为 一 种 最 有 效 的 不 受 时空 限 制 的 语言 交 
际 。 当 然 , 这 种 书信 往来 式 交际 的 反馈 是 十 分 沿 后 的 ;并 且 , 传 递 信 
件 是 要 付出 很 大 的 代价 的 。 比 如 ,中 国 古 代 官 府 耗费 大 量 民 脂 民 高 
来 修筑 驿道 ,专门 用 以 传递 政府 公文 。 可 惜 的 是 ,这 种 专门 为 通讯 服 
务 的 交通 设施 ,并 未 惠及 寻常 百姓 ,更 未 带 来 通讯 的 社会 化 和 商业 
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化 。 
上 面 所 述 的 这 种 情况 ,可 以 概括 地 称 为 用 文字 符号 来 突破 语言 
交际 的 时 空 限 制 。 


2 ”用 技术 手段 突破 语言 交际 的 时 空 限制 


进入 工业 革命 时 代 以 后 ,在 近代 自然 科学 和 声 、` 光 \ 电 技术 的 激 
励 下 ,电话 发 明了 ,使 得 远 在 千里 之 外 的 人 们 可 以 直接 对 话 。 相 应 
地 ,人 类 的 口头 语言 交际 发 生 了 一 场 深 刻 的 革命 。 电 话 在 战争 中 起 
了 十 分 重要 的 作用 ,古人 说 的 “运筹 于 帷 怪 之 中 ,决胜 于 千里 之 外 ”得 
到 了 真正 的 实现 。 这 可 以 看 作 是 用 技术 的 手段 来 突破 口头 语言 交际 
的 空间 限制 ,但 是 电话 显然 未 能 突破 语言 交际 的 同时 性 限制 。 随 后 ， 
无 线 电 技 术 的 进步 促使 了 电报 的 发 明 ; 于 是 ,书信 这 种 人 类 的 书面 语 
言 交 际 样式 在 速度 上 发 生 了 革命 性 的 变化 。 从 理论 上 看 ,电报 倒是 
继承 了 文字 和 书信 那 种 突破 语言 交际 的 时 空 限制 的 优良 传统 ,并 且 
在 速度 上 又 克服 了 书信 的 邮递 周期 长 的 缺点 。 但 是 ,电报 依赖 手 编 
码 和 译 码 ,无 疑 把 书信 交际 代价 高 的 缺点 大 大 地 放大 了 。 即 使 是 精 
简 到 干巴 巴 的 电报 式 语 言 ,也 未 能 抵 销 这 种 高 昂 的 代价 。 因 此 ,电报 
从 来 就 没有 成 为 人 们 的 一 种 普遍 使 用 的 交际 方式 。 

随 着 电磁 技术 的 发 展 , 录 音 的 技术 和 装置 有 了 长 足 的 进展 。 于 
是 ,把 录音 设备 负载 在 电话 上 就 成 为 录音 电话 。 这 在 一 定 程 度 上 可 
以 克服 语言 交际 的 同时 性 限制 。 但 是 ,录音 电话 无 法 实现 大 们 口头 
交际 的 一 个 基本 的 要 求 , 即 及 时 地 反馈 信息 并 形成 听 说 的 轮 替 。 因 
此 ,录音 电话 在 现在 也 并 不 是 人 们 普遍 使 用 的 通讯 设备 。 传 真 机 的 
发 明 , 有 效 地 克服 了 书信 往来 周期 长 .电报 需要 编码 和 译 码 的 缺点 。 
并 且 , 除 了 书信 之 外 ,传真 机 利用 光电 效应 还 可 以 把 照片 图表、 证 
件 ,文件 等 的 真迹 传送 到 远方 。 因 此 , 随 着 传真 的 普及 ,电报 业务 日 
趋 萎 缩 。 虽 然 , 在 双方 都 拥有 传真 机 的 条 件 下 ,可 以 形成 快速 的 书面 
交际 反馈 ;但 是 ,书面 语言 不 如 口语 那样 简便 灵活 ,因此 电话 仍 是 远 
距离 通讯 的 最 方便 和 最 有 效 的 手段 。 
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3 通信 设备 的 移动 化 和 杂交 化 


除了 同时 性 限制 之 外 ,电话 的 另 一 个 缺点 是 : 设备 固定 ,不 能 随 
身 携带 。 结 果 , 虽 然 城市 中 到 处 章 立 着 电话 亭 ,但 是 人 们 仍然 觉得 不 
能 得 心 应 手 地 使 用 ,主要 是 不 能 随时 随地 想 用 就 用 。 为 了 对 付 这 种 
困难 ,移动 电话 (手机 ) 就 应 运 而 生 。 在 克服 了 成 本 高 这 一 因素 以 后 ， 
手机 现在 使 用 得 十 分 普遍 。 并 且 * 手 机 还 可 以 跟 家 里 的 座机 连结 起 
来 ,在 家 中 无 人 值守 时 让 座机 电话 转发 到 手机 上 。 这 就 充分 实现 了 
口语 通讯 的 移动 化 和 便捷 化 。 

跟 这 种 远 距 离 口语 交际 的 技术 革命 差不多 同时 , 远 葡 离 书面 语 
交际 也 在 进行 又 对 烈 烈 的 技术 革命 。 随 着 网 络 技术 的 发 展 , 把 电话 
线 ( 或 网 线 ) 跟 个 人 电脑 连 在 一 起 ,就 可 以 进行 电子 邮件 的 交互 传送 。 
其 传输 速度 之 快 使 得 交互 反馈 非常 迅速 和 及 时 。 这 样 ,不 要 说 电报 ， 
就 是 传真 都 受到 排挤 了 。 并 且 , 还 可 以 手机 电脑 化 ,增加 存储 和 显示 
功能 ;于 是 ,就 可 以 把 电脑 跟 手 机 连结 起 来 ,让 电脑 上 的 电子 邮件 在 
手机 上 显示 出 来 。 这 样 ,不 同 的 通讯 设备 真正 做 到 了 杂交 并 发 挥 出 
功能 上 的 杂交 优势 。 更 进一步 ,直接 在 手机 上 输入 和 收发 短信 。 使 
得 在 深夜 、 开 会 .上课 看 演出 等 不 便 使 用 有 声 语言 的 场合 ,也 可 以 用 
书面 语言 来 进行 语言 交际 。 这 就 难怪 手机 短信 现在 竟 成 了 痢 男 她 女 
们 谈 情 说 爱 的 最 佳 方式 , 因为 它 可 以 快速 地 表达 一 些 盖 于 说 出 口 的 
情感 ,又 可 以 夸张 地 措辞 ,而 对 方 则 可 以 从 容 地 选择 应 对 的 方式 和 词 
句 。 


4 手机 短信 怎样 突破 输入 的 瓶颈 ? 


随 着 手机 短信 的 广泛 使 用 ,汉字 输入 的 瓶颈 就 显得 十 分 突出 。 
怎么 办 ? 至 少 有 两 种 思路 ,一 种 是 绕 着 走 , 回 归 到 手机 作为 有 声 口语 
交际 的 远程 通讯 工具 这 一 本 来 面目 上 来 。 比 如 ,在 手机 上 增加 耳麦 
就 可 以 在 大 庭 广 众 不 影响 别人 地 听 电 话 ;同样 ,在 手机 上 增加 录音 装 
置 则 可 以 把 电话 留存 起 来 ,等 到 方便 的 时 候 再 听 。 也 就 是 说 ,录音 手 
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机 的 市 场 需求 是 迫切 的 ,应 该 尽早 地 推出 来 。 对 于 关机 的 用 户 ,通讯 
总 部 可 以 给 予 保留 ,等 到 他 开机 时 再 把 录音 发 给 他 。 从 理论 上 讲 , 录 
音 手机 是 一 种 缓冲 式 的 移动 通讯 工具 ,可 以 避 开 不 合适 的 时 机 又 不 
影响 最 终 听 到 电话 。 当 然 , 这 种 缓冲 式 通讯 的 反馈 势必 也 会 滞后 ,不 
能 形成 及 时 的 交互 通讯 。 

另 一 种 是 在 手机 上 设置 书写 功能 。 但 是 ,现在 手机 上 用 拼音 输 
入 法 书写 短信 殊 为 不 便 ,一 个 键 上 印 了 三 个 拼音 字母 , 按 一 下 这 三 个 
字母 都 出 现 ,再 按 选 择 健 选 择 ,……* 最 后 才 从 一 串 同音 字 中 找到 你 有 要 
的 那个 汉字 。 挑 选 标点 符号 更 为 不 便 。 这 极 大 地 限制 了 手机 作为 书 ， 
写 和 传递 书信 的 通讯 工具 。 

因此 ,我 们 必须 设法 打破 文字 输入 的 瓶 项 ,通过 增加 按键 ` 扩 大 
屏幕 :改进 输入 方案 储存 常用 语句 、 优 化 菜单 等 ,在 硬件 和 软件 两 方 
面 着 力 。 其 中 有 一 种 彻底 的 做 法 是 : 增加 书写 板 ,把 手写 的 短信 作 
为 一 个 图 像 发 出 去 。 显 然 ,这 种 方式 传输 的 数据 量 大 ,手机 的 造价 也 
会 增 大 ,还 存在 诸多 技术 上 的 困难 。 一 种 讨 巧 的 办 法 是 ;增加 一 个 跟 
电子 词 则 的 接口 。 这 样 , 可 以 把 电子 词典 兼用 作 输入 键盘 和 打字 机 。 
如 果 电 子 词典 中 存 有 大 量 的 词汇 和 常用 语句 ,并 且 提 供 多 种 检索 和 
输入 方法 ;那么 ;这 种 外 接 方式 将 是 很 有 市 场 前 景 的 。 还 有 一 种 极为 
朴素 和 繁 拙 的 向 法 是 回 到 电码 本 时 代 , 充 分 利用 常用 汉字 数量 有 限 
的 特点 ,把 7000 个 通用 汉字 编 成 数字 代码 手册 。 当 然 , 手 册 上 要 提 
供 拼 音 、 部 首 等 多 种 检索 方法 。 这 样 ,任何 一 个 汉字 一 定 在 4 位 数 之 
内 得 到 了 编码 ;并 且 , 越 常用 的 越 靠 前 ,因而 数字 越 短 。 用 户 边 查 手 
册 边 输入 数字 ,端的 不 方便 ,但 是 十 分 保险 ;因为 你 总 能 用 你 最 熟悉 
的 方法 查 到 你 要 的 汉字 ,相应 地 也 就 找到 了 数字 代码 。 诸 如 此 类 的 
方法 还 有 许多 , 拿 出 来 在 现代 通讯 技术 的 背景 上 检讨 一 下 ,看 看 怎样 
改造 和 组 合 ,也 许可 以 帮助 我 们 拓宽 思路 ,为 打破 文字 输入 \ 刀 至 还 
程 通讯 的 某 些 瓶 颈 提 供 实用 的 门 径 。 


2004 年 4 月 初稿 ,9 月 改定 


走向 多 层面 互动 的 汉语 研究 


本 文 主要 评论 汉语 研究 中 关于 语法 、 词 江 \ 语 音 相互 关 联 的 有 关 研 
究 。 首 先 ,指出 传统 的 语言 研究 语音 `\ 词 汇 ` 语 法 各 自 独 立 , 描 写 语法 学 的 
操作 程序 又 强调 只 能 先 分 析 音 位 、 后 分 析 语 法 ,到 了 生成 语法 时 代 才 确立 
低层 面 的 语音 分 析 和 高 层面 的 语法 分 析 应 该 互动 的 正确 观念 。 接 着 ,从 
汉语 的 结构 面 角 和 汉语 语法 研究 发 展 史 的 角度 ,指出 从 词法 、 形 态 本 位 向 
词组 、 句 子 本 位 转移 是 汉语 语法 研究 的 必然 趋势 ;还 指出 语法 分 析 中 的 句 
法 、 语 义 、 语 用 三 个 平面 除了 要 注意 区 分 之 外 ,更 应 该 研究 这 三 个 平面 上 
的 成 分 之 间 的 配 位 关系 和 相互 关联 的 标记 模式 ,并 考察 语义 、 语 用 因素 的 
语法 化 过 程 , 从 而 沟通 语言 的 共 时 研究 和 历时 研究 。 然 后 ,着 重 评述 有 关 
汉语 语法 和 语音 互动 关系 的 研究 ,指出 国内 学 者 在 传统 语法 和 描写 语法 
的 框架 内 ,对 于 语音 对 语法 的 制约 作用 已 经 作 了 初步 的 探索 ;国外 学 者 在 
生成 语法 和 生成 音 系 学 的 背景 上 ,分 别 探讨 了 语法 结构 对 于 语音 (特别 是 
方言 中 连 读 变调 域 的 界限 ) 的 制约 作用 和 韵律 结构 (特别 是 音 步 组 织 ) 对 
于 语法 结构 的 制约 作用 ,建立 起 了 各 种 颇具 理论 语言 学 色彩 的 理论 模型 。 
最 后 ,讨论 词 库 结构 和 句法 操作 的 互动 关系 ,指出 假设 在 介 于 词 库 和 句法 
表达 之 间 的 论 元 结构 层面 上 的 有 条 件 的 变化 ,可 以 免 去 许多 繁复 的 句法 
操作 。 


1 语言 研究 的 三 分 格局 和 互动 观念 


传统 的 语言 研究 ,基本 上 是 语音 .词汇 和 语法 三 分 天 下 , 呈 易 足 
而 立 之 势 。 这 种 语言 研究 的 三 分 格局 (tripartite paradigm), 直 到 上 
世纪 初 索 绪 尔 (De Saussure) 创 立 了 现代 语言 学 ,依然 没有 受到 多 大 
的 影响 。 因 为 在 《普通 语言 学 教程 》 中 ,语言 被 看 作 是 符号 系统 ,符号 
具有 声音 和 意义 两 重 性 (duality) ,音义 结合 的 符号 可 以 指 涉 (de- 
note) 或 代表 (represent) 外 部 世界 或 精神 世界 中 具体 的 或 抽象 的 事 
物 ; 于 是 ,语音 研究 和 词汇 研究 都 是 语言 研究 的 重要 的 部 门 。 另 外 ， 
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索 绪 尔 强调 符号 之 间 具 有 横向 的 组 合 关 系 和 纵向 的 聚合 关系 ;于 是 ， 
语素 组 合成 词 .词组 合成 短语 .短语 组 合成 句子 .句法 成 分 之 间 的 形 
态 上 的 一 致 关系 等 词法 和 句法 组 合 关系 ,以 及 形式 上 的 聚合 关系 等 
形态 问题 .语法 意义 上 的 聚合 关系 等 语法 范畴 问题 、 同 功能 (分 布 ) 的 
词 之 间 的 聚合 关系 等 词类 问题 ,都 必须 纳入 语法 的 两 个 部 门 ( 词 法 和 
名 法) 中 进行 研究 。 后 来 ,在 布 龙 菲 尔 德 (L. Bloomfield, 1933 ) 的 
《语言 论 》, 乃 至 霍 凯特 (CHocKett,1958) 的 《现代 语言 学 教程 》 中 ， 
也 都 是 顺 着 语音 .词汇 (语素 或 意义 ). 语 法 的 次 序 一 路 讲 过 来 。 至 于 
这 三 个 部 门 之 间 的 关系 ,好 像 没 有 人 正面 说 有 或 无 ;反正 在 实际 上 一 
般 是 各 自 为 政 ,分 而 治之 的 。 
到 了 后 布 龙 菲尔德 学 派 (post-Bloomfieldian school) 那 儿 ，, 情 况 
有 了 很 大 的 改变 。 因 为 ,他 们 强调 语言 研究 的 发 现 程序 (discovery 
procedure) ;于 是 ,只 能 通过 对 立 .互补 等 分 布 分 析 的 操作 程序 , 先 发 
现 能 区 别 意 义 的 最 小 的 语音 单位 ( 即 音 位 ) ,然后 再 发 现 最 小 的 有 意 
义 的 语言 单位 ( 即 语素 ), 最 后 发 现 语素 类 及 其 配 列 方式 ( 即 句 型 ) .9 
按照 他 们 的 理论 ,这些 步骤 之 间 不 能 窜改 ,否则 就 是 自 乱 步伐 。 一 且 
这 种 工作 假设 成 了 教条 ,就 连 极 有 田野 工作 经 验 的 语言 学 家 ,也 只 得 
把 它们 奉 为 不 可 逾越 的 金 科 玉 律 。 最 有 趣 的 例子 是 董 同 饰 先 生 , 他 
在 《四 个 闽南 方言 》(《 历 史 语言 研究 所 集刊 } 第 三 十 本 ,第 729 一 1042 
页 ,1959 年 ) 中 写 道 : 
所 谓 “ 变 调 ? 和 “本 调 ? 不 同 是 在 实际 语言 中 语 位 和 语 位 相 
接 的 时 候 才 显示 出 来 的 。 以 前 曾 说 :“ 凡 单独 出 现 , 在 轻声 字 
前 ,在 句 尾 ,在 主语 之 末 , 在 表 时 地 的 副词 之 末 ， 在 名 词 或 动词 
系列 中 各 名 词 或 动词 之 尾 的 , 同 是 一 个 调 值 ; 在 别 个 字 前 面 而 
不 属 上 述 各 种 情形 的 ,又 另 是 一 个 调 值 。”(《 厦 门 方言 的 音 
韵 》《 历 史 语 言 研 究 所 集刊 》 第 二 十 九 本 ,第 242 页 ,1958) 那 
大 致 是 从 语法 上 的 地 位 来 分 ,说 起 来 简单 而 容易 了 解 。 不过， 
近来 有 人 觉得 : 在 语言 分 析 的 过 程 中 ,如 果 在 作 音 位 分 析 的 


@ 袁 航 林 (2000b) 对 此 有 一 个 简要 的 总 结 ,更 详细 的 讨论 ,请 看 Hockett(1942， 
1947) 和 Harris(1946,1951) 等 。 
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时 候 就 谈 语 法 上 的 区 分 ,理论 上 似乎 颇 有 问题 。 如 此 ,作者 以 
为 闽南 话 “ 变 调 ? 和 "本 调 ? 的 不 同 未 始 不 可 以 照 他 们 的 另 一 个 
说 法 解释 作 语 音 的 “接合 形态 ”(junctural feature) 的 不 同 。 换 
言 之 , 凡 用 “变调 ?的 是 和 后 面 的 成 分 接合 比较 紧凑 的 , 凡 用 
“本 调 ” 的 是 和 后 面 的 成 分 接合 比较 松弛 或 者 后 面 有 停顿 。 总 
之 ,无 论 怎样 去 解释 ,这 都 是 语言 分 析 上 ,尤其 是 形态 音 位 学 
方面 ,一 个 很 有 意思 的 问题 ,值得 我 们 多 加 思索 。 暂 时 ,我 们 
以 记 出 现象 为 已 足 。 
对 此 , 李 荣 *1983: 14) 作 出 了 非常 有 启发 性 的 评论 : 

先 讲 音 韵 ,后 讲 语 法 ,音韵 讲 完 之 后 才能 讲 语法 ,否则 叫 
自 乱 步伐 ,理论 上 有 问题 。 这 只 是 美国 某 一 派 语言 学 家 一 时 
的 主张 ,并 非 颠 扑 不 破 的 理论 。 其 实在 这 里 ,用 变调 表示 跟 后 
头 成 分 接合 得 紧 , 用 本 调 表示 跟 后 头 成 分 接合 得 松 。 结 合 得 
松紧 是 从 用 本 调 还 是 用 变调 推出 来 的 ,并 无 其 他 标准 可 以 判 
定 。 用 本 调 还 是 用 变调 ,结合 得 紧 还 是 松 ,是 一 件 事 的 两 方 
面 , 并 不 是 一 种 解释 ,从 语法 地 位 分 才 是 真正 的 解释 。 大 家 都 
知道 ,从 一 九 五 八 年 左右 开始 , 那 一 派 语言 学 家 的 主张 在 美国 
就 失势 了 ,再 也 不 是 主流 派 了 。 由 此 可 见 ,迷信 一 种 流行 的 语 
言 学 理论 是 要 上 当 的 。 研 究 语言 的 人 千 万 别 忘 了 ,实践 是 检 
验 真理 的 标准 ,语言 比 语言 学 丰富 ,语言 学 理论 必须 建立 在 语 
言 事实 的 基础 上 。 


李 先 生 的 分 析 和 议论 是 非常 发 人 深 省 的 。 如 上 所 述 , 后 布 龙 非 尔 德 
学 派 语言 学 的 目标 是 : 通过 执行 一 组 对 语 料 的 操作 来 “发 现 ” 语 法 。 
每 次 连续 的 操作 就 从 语 料 里 进一步 地 去 掉 一 个 步骤 。 由 于 一 连 串 言 
语 的 物理 记录 是 唯一 客观 的 起 点 ,因而 要 达到 语法 描写 的 层面 ,就 必 
须 遵 照 以 下 的 次 序 : (i) 音 位 学 (phonemics) , (ii) 语素 学 (morphe- 
mics) ,Ciii) 句法 学 (syntax),，(Civ) 话语 (Cdiscourse) 。 由 于 先 要 从 言 
语 流 中 把 组 合 在 一 起 的 音 位 抽取 出 来 以 后 才能 找 出 语素 ,因而 在 音 


394 基于 认 知 的 汉语 计算 语言 学 研究 


位 描写 中 不 能 引入 语素 (或 句法 ) 的 信息 .@ 比如 , Hockett (1942: 
19) 就 明确 地 指出 : 
一 定 不 能 有 循环 论证 的 现象 。 我 们 是 为 了 语法 分 析 才 进行 
音 位 分 析 的 ,因而 在 分 析 音 位 的 时 候 不 能 有 语法 部 分 的 任何 假 
设 。 两 者 的 界线 必须 划分 清楚 。 
其 实 ,Hockett (1955: 3) 已 经 指出 , 像 Kenneth Pike 等 研究 者 就 坚 
信 : 为 了 理解 音 位 系统 ,不 仅 需 要 知道 相关 的 语法 系统 的 一 些 事 情 ， 
而 且 要 积极 地 利用 语法 知识 来 作为 音 位 判断 的 标准 。 至 于 生成 语法 
学 者 ,他 们 既然 不 认同 后 布 龙 菲尔德 学 派 的 经 验 主义 研究 理念 和 发 
现 程序 ,自然 也 不 会 理会 这 种 先 音 位 后 语素 、 句 法 等 操作 顺序 方面 的 
教条 。 比 如 ,Chomsky (1957: 59) 就 毫 不 含糊 地 说 ; 


语言 描写 的 高 平面 有 赖 于 低 平 面 获得 的 结果 ,这 的 确 是 一 
个 事实 ;可 是 , 反 过 来 也 是 事实 一 一 会 平面 的 描写 有 赖 于 高 平面 
上 的 结果 。( 中 译本 第 58 页 ) 


可 见 , 进 入 生成 语法 时 代 ,语法 和 语音 这 两 个 平面 应 该 互动 (interac- 
tion) 的 观念 是 牢固 地 确立 了 。 接 下 来 的 任务 是 ,怎样 在 分 析 相 关 的 
语言 现象 时 落实 这 一 观念 ,并 提出 具体 的 研究 步骤 和 操作 方法 。 


2 语法 研究 的 两 个 部 门 和 本 位 意识 


根据 传统 的 说 法 ,语法 研究 可 以 分 为 词法 (形态 ) 学 和 句法 学 两 
个 部 门 ;前 者 研究 语素 怎样 构成 词 , 后 者 研究 词 怎 样 构成 句子 。@ 对 
于 有 形态 屈折 变化 的 语言 来 说 , 像 名 词 的 性 、 数 、 格 和 动词 的 时 、 体 、 
态 ,乃至 词类 范畴 等 大 部 分 语法 信息 ,都 被 纳入 词法 (形态 ) 学 之 中 。 


四 参考 Newmeyer (1986) ，p. 7 一 11; 中 译本 ,第 .8 一 13 页 。 

@ “根据 Crystal (1997) , 按 狭义 理解 ( 即 按 语言 学 的 传统 涵义 和 通行 的 理解 ), 语 法 
指 语言 结构 的 一 个 层面 ,可 独立 于 音 系 学 和 语义 学 进行 研究 ,通常 包含 句法 学 和 形态 学 两 
个 分 支 。 按 这 一 涵义 ,语法 是 研究 词 与 构 词 成 分 如 何 组 织 起 来 形成 句子 。 广 义 的 语法 指 
一 种 语言 的 结构 关系 的 整个 系统 。 于 是 ,除了 句法 学 之 外 ,语法 学 还 包括 音 系 学 和 语义 
学 。 详 见 中 译本 第 163 一 164 页 。 
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词法 (形态 ) 学 实际 上 又 至 少 包 括 构词法 和 构 形 法 两 个 子 部 门 , 构 形 
法 包括 了 形态 变化 .语法 范畴 和 词类 等 语法 的 主要 内 容 。 于 是 ,真正 
的 句法 学 部 分 的 内 容 就 显得 十 分 贫乏 . 比如 ,Jesperson 〈(1933) 共 
三 十 六 章 , 其 中 首 章 和 末 章 讲 导 论 和 回顾 ,第 二 一 六 章 讲 语音 及 拼 
写 ,第 七 .十 四 ~ 二 二 七、 三 十 一 .三 十 三 章 讲 词类 总 论 . 格 \ 估 称 s 伐 
词 、 性 数 、. 级. 时、 助动词 Cwill，shall，would，shotd) 式 (mood) 、 分 
词 \ 不 定式 ;第 人 十 纪 \ 二 十 大 斑马 书 运 币 生 后 去 站 考 束 齐 芋 骆 
(the three ranks) 及 小 句 作 三 品 ( 首 品 、 次 品 . 末 品 六 附加 与 核心 
(Cunction and nexus) 及 其 各 种 表现 .句子 结构 动词 跟 主 语 与 宾语 的 
关系 、 被 动 式 . 谓 语 . 肯定、 和 否定、 疑问 。 讲 词法 的 篇 幅 远 远 多 于 讲 句 
法 的 ,并 且 像 肯定 、 和 否定 .疑问 又 是 从 表达 的 角度 讲 的 。 总 体 上 是 从 
理解 的 角度 来 组 织 语法 知识 的 ,中 间 又 穿插 从 表达 的 角度 来 叙述 ; 因 
此 ,整个 体系 显得 有 点 儿 凌 乱 。 传 统 语法 如 此 ,到 了 结构 主义 语法 依 
然 没 有 太 大 的 改观 。 比 如 ,根据 Hockett (1954) 的 说 法 ,在 描写 语法 
现象 和 组 织 语法 知识 方面 ,传统 语法 学 用 的 是 词 和 词 形变 化 表 
Cword and paradigm) 模 式 (简称 WP 模式 ) ,结构 语法 学 用 的 或 者 是 
项 目 和 配 列 (item and arrangement) 模 式 ( 简 称 IA 模式 ) ,或 者 是 项 
目 和 变化 (item and process) 模 式 ( 简 称 IP 模式 )。 顾 名 思 义 ,WP 模 
式 以 叙述 词 形 变化 来 组 织 语法 知识 ,结果 自然 是 语法 学 约 等 于 词法 
(形态 ) 学 。IA 模式 和 了 PP 模式 本 来 可 以 侧重 分 析 句 子 的 构造 ,但 是 
Hockett (1954) 举 的 例子 主要 是 怎样 描写 动词 过 去 式 的 构成 方式 。 
比如 ,bake 十 -ed 王 baked, 是 take 十 -ed 一 took 还 是 take 十 a 一 -0 三 
took ,等 等 。 结 果 , 给 人 的 印象 依然 是 语法 学 约 等 于 词法 (形态 ) 学 。 
当然 ,结构 语法 学 跟 传统 语法 学 相 比 ,在 句法 分 析 方 面 的 进步 还 是 有 
的 ,只 是 并 不 太 多 而 已 。 比 如 ,提出 了 结构 层次 (Cstructural hierar- 
chy) 的 概念 ,用 以 说 明和 分 析 old men and women 一 类 结构 歧义 现 
象 。 特 别 是 布 龙 菲 尔 德 之 后 的 学 者 ,还 发 展 出 替换 、 扩 展 、 紧 缩 乃 至 


@ 详 见 陈 平 (1988) 。 
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概率 统计 等 一 整套 直接 成 分 (immediate constituents) 分 析 方 法 .0 
后 来 , Zellig Harris 又 提出 了 变换 分 析 法 (transformational analy- 
sis) 。 除 此 之 外 ,好 像 说 不 出 太 多 的 内 容 来 了 。 真 正 的 句法 研究 的 
繁荣 , 那 是 Noam Chomsky 创立 转换 生成 语法 学 以 后 的 事情 了 。 也 
就 是 说 ,五 十 年 代 末 以 后 句法 学 才 真正 成 为 语言 学 的 中 心 。 

汉语 语法 学 是 在 西方 语法 学 说 的 强烈 影响 下 发 展 起 来 的 ,一 开 
始 的 语法 学 模式 自然 是 词 本 位 的 语法 学 。 比 如 , 马 建 忠 出 版 于 1898 
年 的 4 马 氏 文通 》, 是 中 国 第 一 部 比较 系统 的 语法 著作 。 全 书 共 十 章 ， 
绪论 部 分 为 “ 字 类 、 句 读 ? 正 名 ,第 一 一 九 章 讲 名 字 、 代 字 、 名 代 之 次 、 
静 字 \ 动 字 、 状 字 、 介 字 . 连 字 、 助 字 和 叹 字 ，, 第 十 章 讲 起 词 .语词 ` 止 词 
等 句法 成 分 和 顿 . 读 、 句 等 句法 单位 。 汉 语 虽 然 没 有 形态 变化 ,但 是 
众多 的 虚词 也 足以 使 得 这 种 以 词 为 中 心 的 语法 体系 羽毛 丰满 。 黎 锦 
申 1924 年 出 版 的 4 新 著 国 语文 法 》, 是 我 国 第 一 部 白话 语法 。 其 中 提 
出 了 句子 本 位 的 语法 ,在 当时 堪 称 是 一 种 新 潮 的 观念 。 全 书 共 三 
章 ,第 一 章 为 绪论 , 讲 词 、 句 、 词 类 和 和 句法 及 其 关系 等 ;第 二 章 讲 词类 
的 区 分 和 定义 ,第 三 章 讲 单 句 的 六 大 成 分 及 其 图 解法 ,第 四 章 讲 实体 
词 的 七 位 ,第 五 章 讲 主 要 成 分 的 省 略 ;第 六 一 十 一 、 十 五 一 十 八 章 讲 
名 词 .代词 动词. 形容词、 副词 介词. 连词. 助词, 叹 词 及 相关 的 句法 
问题 ;第 十 二 章 讲 单 句 的 复 成 分 ( 即 词组 作 名 子 成 分 ) ,第 十 三 章 讲 附 
加 成 分 的 后 附 ,第 十 四 章 讲 包 孕 复 句 ( 即 小 句 作 句子 成 分 ); 第 十 九 章 
讲 篇 章 和 修辞 ,第 二 十 章 讲 标点 符号 。 究 其 实质 ,还 是 难以 跳出 他 在 
引 论 中 所 批评 的 那 种 案 白 ;摹仿 从 前 西 文 Grammar 的 “词类 本 位 
的 文法 组 织 ，…… 仅 就 九 品 词类 ,分 别 汇集 一 些 法 式 和 例证 , 弄 成 九 
个 各 不 相关 的 单位 …… o 于 是 ,该 书 除了 六 大 句子 成 分 和 相应 的 图 
解法 (Diagram) 之 外 ,真正 关于 句法 的 东西 并 不 多 。 可 见 , 少 讲 一 点 
儿 词 法 .多 讲 一 点 儿 句 法 ,在 当时 是 不 能 也 , 非 不 为 也 。 就 是 赵 元 任 
1968 年 出 版 的 英文 版 《中国 话 的 文法 》 虽 然 采 用 结构 主义 的 描写 方 
法 ,但 是 仍然 以 词法 为 主 \ 句 法 为 辅 。 全 书 共 八 章 , 第 一 章 序 论 , 讲 语 


@ 详 见 Bloomfield (1933) ,Wells (1947), Hockett (1958) 等; 中文 介 绍 和 汉语 层次 
分 析 方 法 问题 , 详 见 范 继 济 (1964/1983) 。 
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法 .语音 口语 等 问题 ;第 二 章 讲 句 子 、 第 五 章 讲 句法 类 型 ,属于 句法 
问题 ;第 三 章 讲 词 和 语素 .第 四 章 讲 形 态 类 型 .第 六 章 讲 复 合 词 、 第 
七 ` 八 章 讲 各 别 词类 ,属于 词法 (形态 ) 问 题 。 难 怪 汤 延 池 (1983) 要 批 
评 : 在 语 料 的 选择 方面 稍 嫌 守 旧 , 而 且 在 学 术 观 点 上 依旧 偏向 以 词 
为 本 位 的 传统 语法 分 析 …… ”( 第 150 一 151 页 )。 倒 是 先前 的 吕 叔 湘 
《1942 认 中 国文 法 要 略 兴 简称 (要略 力 和 王 力 (1943) 中 国 现代 语法 》 
《简称 《语法 访 , 差 不 多 在 同时 不 约 而 同 地 尝试 加 大 句法 部 分 的 比重 。 
《要 略 》 分 上 下 两 卷 , 上 卷 “ 词 句 论 ” 占 全 书 不 到 三 分 之 二 的 篇 幅 , 第 

章 讲 字 和 词 等 词法 问题 ,第 二 章 讲 词类 及 其 配合 关系 ,第 三 一 五 章 讲 
叙事 句 、 表 态 句 、 判 断 句 .有 无 句 ; 第 六 章 讲 句子 和 词组 的 转换 , 开 了 
研究 汉语 句法 结构 变换 关系 的 先河 ;9 第 七 章 讲 繁 名 (包含 多 个 词组 
的 句子 ) ,第 八 章 讲 句法 的 变化 ;下 卷 表达 论 占 全 书 三 分 之 二 以 上 的 
篇 幅 , 把 数量 词 代词 方位 词 . 时 间 词 .和 否定 词 .助动词 .语气 词 .连词 
及 其 用 法 ,分 别 纳入 数量 指称 (包括 有 定 和 无 定 ) 时间、 正 反 。 虚 
实 、 传 信 、 传 疑 . 行 动 。 感情 等 意义 范畴 和 离合 . 向 背 . 异 同 。 高 下 、 
同时 。 先后、 释 因 。 纪 效 、 假 设 . 推论 、 擒 纵 。 衬托 等 意义 关系 中 加 
以 讨论 。 一 般 的 语法 书 大 多 是 从 听 和 读 等 理解 的 角度 来 组 织 的 , 通 
常 都 以 语法 形式 (结构 .语序 虚词) 为 纲 来 说 明 其 所 表达 的 语法 意 
义 。 由 于 汉语 的 结构 和 语序 在 当时 的 研究 水 平 之 下 可 说 的 实在 不 
多 ,于 是 虚词 等 词法 的 内 容 就 势必 膨胀 。 像 要略》 表达 论 中 的 这 些 
内 容 , 一 般 都 是 放 在 词法 中 讨论 的 。 但 是 , 吕 先 生 在 F. Bruneot 
〈1922) La Pensee el 1a 工 azagzue 的 影响 下 ,别出心裁 地 从 说 和 写 的 人 
的 角度 出 发 ,以 语法 意义 (各 种 范畴 和 关系 ) 为 纲 来 说 明 其 赖 以 表达 
的 语法 形式 .2 因此 ,虽然 作者 在 写作 上 沿用 的 是 前 人 写 书 讲 虚词 
和 句 读 的 传统 精神 : 类 集 用 例 、 随 宜 诠 释 、 稍 加 贯通 ,但 是 不 仅 给 人 
耳目 一 新 的 感觉 ,而 且 确 实 对 于 读者 理解 和 运用 各 种 词类 和 语法 格 
式 有 很 大 的 帮助 。@ 至 于 王 力 先 生 , 他 在 写作 《语法 》 的 时 候 已 经 认 


考 朱 德 辕 先 生 为 商务 印 书 馆 《 汉 语 语法 丛书 ?所 写 的 序 , 第 3 页 。 
虽 板 湘 先生 1982 年 为 该 书写 的 “重印 题记 ”, 第 5 页 。 


O 参 
Q@ 详 见 
加 ” 详 见 吕 叔 湘 先生 1956 年 为 该 书写 的 “修订 本 序 ”, 第 12 页 。 
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识 到 : 他 在 清华 (国学 ) 研 究 院 做 的 论文 (中 国 古 文法 》 除 了 死 文法 
和 活 文法 的 分 别 . 词 有 本 性 准 性 变性 等 说 法 颇 有 可 取 之 处 ,其 余 就 殊 
无 可 观 。 因 为 “当时 的 毛病 是 只 知 有 词 不 知 有 名 ;只 知 斤 斤 于 词类 的 
-区 分 ,不 知 中 国语 法 真正 特征 之 所 在 ;只 知 从 英语 语法 里 头 找 中 国语 
法 的 根据 ,不 知 从 世界 各 族 语言 里 头 找 语法 的 真 诠 ”( 自 序 第 2 页 )。 
于 是 ,在 他 的 《语法 )》 中 ,第 一 、 二 章 讲 造句 法 ,词类 、 词 品 问题 也 纳入 
其 中 ,特别 是 提出 了 能 愿 式 、 使 成 式 . 处 置式 、 被 动 式 、 递 系 式 、 紧 缩 式 
等 句法 格式 ;第 三 章 讲 语法 成 分 ,把 系 词 .否定 词 , 副 词 . 记 号 (结构 助 
词 “ 的 .所 ”前 级 “第 ”后 级 “ 子 . 儿 、 头 ”时 态 助词 <“ 了、 着 ”等 ) .语气 
词 .连接 词 ( 结 构 助词 < 的、 连词 “< 和” 介词“ 于、 以 等 ) 纳 入 其 中 ;第 
四 章 讲 替 代 法 和 称 数 法 ,把 代词 、 数 词 等 纳入 其 中 ;第 五 章 讲 倒 装 、 省 
略 等 特殊 形式 ,除了 讨论 复 说 、 倒 装 、 省 略 等 句法 问题 外 ,把 重奏 、 复 
合 等 构词法 .乃至 拟 声 . 侈 状 等 造 词法 的 内 容 也 纳入 其 中 ;第 六 章 讲 
欧 化 的 语法 。 到 了 本 声 树 等 (1961)《 现 代 汉语 语法 讲话 》( 简 称 《 讲 
话 为 ,句法 的 内 容 已 经 占 语 法 的 主导 地 位 。《 讲 话 》 分 别 列 专 章 讲 名 
法 结构 句子 类 型 .主语 、 宾 语 、 修 饰 语 、 补 语 \ 连 动 式 \ 兼 语 式 、 连 锁 
式 、 复 合成 分 .复合 句 、. 问 句 等 句法 问题 ,就 是 讲 词类 也 是 着 眼 于 词 的 
用 法 ( 即 句法 分 布 )、 讲 语气 词 也 是 以 疑问 、 祈 使 测度 、 陈 述 、 停 顿 等 
语 用 功能 为 纲 来 组 织 的 。 朱 德 申 (1982) 共 十 八 章 ,第 一 章 讲 语法 单 
位 ;第 二 章 讲 词 的 构造 ,属于 词法 (形态 ) 问 题 ;第 七 一 十 三 章 讲 主 谓 、 
述 宾 、 述 补 、 偏 正 、 联 合 . 连 谓 等 句法 结构 ,第 十 五 章 讲 疑问 名 和 祈 使 
名 ,第 十 七 章 讲 复句 ,第 十 八 章 讲 省 略 和 倒 装 , 都 属于 句法 问题 。 第 
三 一 六、 十 三 .十 四 、 十 六 章 分 别 讲 各 种 词类 ,但 是 作者 强调 “汉语 不 
像 印 欧 语 那样 有 丰富 的 形态 。 因 此 给 汉语 的 词 分 类 不 能 根据 形态 ， 
只 能 根据 词 的 语法 功能 。…… 一 个 词 的 语法 功能 指 的 是 这 个 词 在 名 
法 结构 里 所 能 占据 的 语法 位 置 ”第 37 页 ), 所 以 完全 是 以 句法 结构 
(词组 ) 为 本 位 的 ,@ 看 来 ,从 词法 .形态 本 位 向 词组 句子 本 位 转移 
是 汉语 语法 研究 的 必然 趋势 。 


四 “关于 在 词组 的 基础 上 来 描写 名 法、 建立 一 种 以 词组 为 基点 的 语法 体系 的 思想 , 详 
更 朱德 处 (1985) 第 74 一 79 页 ， 
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顺便 说 一 句 ,在 大 陆 的 现代 汉语 语法 学 界 ,前 些 年 对 于 语法 研究 
的 本 位 意识 明显 地 增强 ,提出 了 一 些 显然 不 同 于 朱德 申 先 生 的 “词组 
本 位 ”的 观点 。 比 如 , 徐 通 销 先 生 提 出 了 * 字 本 位 ”的 学 说 , 邢 福 义 先 
生 提 出 了 “小 句 中 枢 ?的 学 说 ;此 后 ,又 有 马 庆 株 先 生 提 出 词 和 句子 的 
“ 双 东 位 ”学 说 ,以 及 大 多 数学 者 隐 而 不 发 的 “无 本 位 ?思想 。 我 们 认 
为 ,只 要 不 单纯 是 停留 在 喊 口号 、 树 旗帜 的 层面 ,从 不 同 的 角度 思考 
语法 研究 的 立 是 点 ,尝试 建立 新 的 组 织 语法 知识 的 描写 体系 ,肯定 是 
有 其 积极 意义 的 。 在 此 ,我 们 就 不 多 作 评 论 了 。 


3 语法 分 析 的 三 个 平面 及 其 互动 关系 


上 个 世纪 八 十 年 代 初 ,中 国内 地 语法 学 界 引 进 了 语法 分 析 的 三 
个 平面 的 观念 。 于 是 ,原来 许多 纠葛 不 清 的 问题 终于 可 以 有 一 个 名 
正言 顺 的 说 法 了 。 比 如 ,最 著名 的 主 宾语 问题 ,到 底 是 根据 位 置 关 系 
(在 动词 前 或 后 ) ,还 是 根据 意义 关系 ( 施 事 、 受 事 等 ) ,还 是 综合 考虑 
两 者 ,在 五 十 年 代 是 争论 不 清 的 .@ 现在 ,朱德 嘻 (1982) 可 以 用 三 个 
平面 的 观念 举重 若 轻 地 说 : 


主语 和 谓语 的 关系 可 以 从 结构 .语义 和 表达 三 个 不 同 的 方 
面 来 观察 。 从 结构 上 看 ,在 正常 的 情况 下 ,主语 一 定 在 谓语 之 
前 ,两 者 之 间 的 关系 , 跟 其 他 各 种 句法 结构 比较 起 来 ,要 算是 最 
粉 的 。 这 主要 表现 在 以 下 两 点 上 : 第 一 ,主语 和 谓语 之 间 往 往 
可 以 有 停顿 ,而 且 后 头 可 以 加 上 “ 啊 、 呢 、 吧 、 吐 ”等 语气 词 跟 谓语 
二 开光 定 第 二 ,只 要 不 引起 误解 ,主语 往往 可 以 略 去 不 


从 语义 上 看 ,主语 和 谓语 的 关系 是 很 复杂 的 。 拿 动词 组 成 
的 谓语 来 说 ,主语 所 指 的 事物 中 动词 所 表示 的 动作 祥 间 的 六 系 
是 各 种 各 祥 的 。 有 的 主语 指 的 是 动作 的 发 出 者 , 即 所 谓 范 事 $ 有 
的 是 受 动作 影响 的 事物 , 即 所 谓 受 事 ; 有 的 是 施 事 、 受 事 以 外 的 


@ 详 见 1955 年 7 月 至 1956 年 3 月 在 (语文 学 习 》 上 进行 的 关于 主语 宾语 的 讨论 , 文 
章 收入 (中 国语 文 ;杂志 社 编 4 汉 语 的 主语 宾语 问题 》, 中 华 书局 ,1956 年 。 
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另 一 方 , 可 以 称 为 “与 事 ”; 有 的 是 动作 凭借 的 工具 ;有 的 主语 表 
示 动 作 发 生 的 时 间或 处 所 。…… 注 意 不 要 把 主语 跟 动 作 的 施 事 
混为一谈 。 

从 表达 上 说 ,说 话 的 人 有 选择 主语 的 自由 。 同 样 的 意思 ， 可 
以 选择 施 事 作 主语 ,也 可 以 选择 受 事 或 与 事 作 主语 。…… 说 话 
人 选 来 作 主语 的 是 他 最 感 兴趣 的 话题 ,谓语 则 是 对 于 选 定 了 的 
话题 的 陈述 。 通 常 说 主语 是 话题 ,就 是 从 表达 的 角度 说 的 ,至 于 
说 主语 是 施 事 、 受 事 或 与 事 , 那 是 从 语义 的 角度 说 的 ,二 者 也 不 
能 混同 。( 第 95 一 96 页 ) 
朱德 咎 (1985: 37) 则 总 结 性 地 指出 ; 

进行 语法 分 析 , 一 定 要 分 清 结构 .语义 和 表达 三 个 不 同 的 平 
面 。 结 构 平 面 研 究 句 子 里 各 部 分 之 间 形 式 上 的 关系 。 语 义 平 面 
研究 这 些 部 分 意义 上 的 联系 。 表 达 平面 研究 同一 种 语义 关系 的 
各 种 表达 形式 之 间 的 区 别 。 这 三 个 方面 婚 有 联系 ,又 有 区 别 ,不 
能 混为一谈 。 在 上 面 提 到 的 那些 概念 里 ,主语 、 宾 语 属 于 结构 平 
面 , 施 事 、 受 事 属 于 语义 平面 ,话题 .陈述 属于 表达 平面 。 


上 面 朱 先生 所 说 的 结构 平面 ,一 般 称 为 句法 平面 (syntactic plane) ， 
表达 平面 一 般 称 为 语 用 平面 (pragmatic plane)。 按 照 我 们 的 理解 ， 
语法 理论 模型 中 的 语 用 平面 的 研究 内 容 ,可 以 更 明确 地 界定 为 : 研 
究 语 义 相同 或 相近 的 各 种 句法 格式 在 语 用 上 的 差别 ,包括 它们 对 于 
不 同 的 语 境 (context) 的 适应 情况 以 及 在 会 话 涵义 等 推导 意义 方面 
的 差别 。 

当 三 个 平面 的 概念 深入 人 心 的 时 候 , 人 们 自然 地 会 拿 这 三 个 平 
面 跟 传统 的 语音 .词汇 ` 语 法 三 分 格局 和 词法 (形态 )、 句 法 二 分 格局 
进行 比较 。 于 是 ,疑问 也 就 随 之 而 来 : 跟 语 法 分 析 关 系 密切 的 语音 
和 词汇 、 特 别 是 词法 (形态 ) ,怎么 在 三 个 平面 的 分 析 框 架 中 就 没有 地 
位 了 ? 其 实 ,众所周知 ,语法 分 析 的 三 个 平面 的 观念 是 从 符号 学 (se- 
miotic) 和 数理 逻辑 (mathematical logic) 中 借 来 的 。 在 这 两 门 主要 
研究 符号 表达 式 的 构造 和 推导 关系 的 学 科 中 ,把 对 符号 表达 式 的 研 
究 分 成 三 个 平面 : (iD 句法 学 (syntax) ,研究 符号 与 符号 之 间 的 结构 
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关系 ,特别 是 什么 样 的 符号 表达 式 才 是 合式 的 (well-formed) ;(ii) 语 
义学 (semantics) ,研究 符号 与 所 指 (referent) 之 间 的 关系 ,特别 是 符 
号 表达 式 为 真 的 世界 模型 ( 即 真 值 条 件 ,truth condition); (iii) 语 用 
学 (pragmatics) ,研究 符号 与 语 境 ( 包 括 说 话 人 和 听话 人 ) 的 关系 , 特 
别 是 符号 表达 式 在 不 同 语 境 中 的 各 种 推导 性 的 意义 。 既 然 符号 学 和 
数理 逻辑 以 形式 语言 (formal language) 的 符号 为 起 点 ,自然 不 会 考 
虑 自然 语言 (natural language) 中 的 语音 、 词 法 等 问题 。 因 此 ， 这 个 
平面 只 是 语法 分 析 中 一 种 观察 问题 的 角度 (perspective) ,而 不 是 语 
法 分 析 的 全 部 。 

事实 上 ,我 们 不 仅 应 该 分 清 语法 的 三 个 不 同 的 平面 ,而 且 应 该 观 
察 这 三 个 不 同 的 平面 之 间 的 互动 关系 。 比 如 ，, 像 陈 平 (1994) 那 样 , 研 
究 施 事 、 受 事 等 语义 成 分 跟 主语 、 宾 语 等 句法 成 分 之 间 的 配 位 关系 
(argument selection) 。 并 且 , 还 可 以 引 入 语言 类 型 学 的 视野 ,比较 
不 同 语言 在 配 位 方式 上 的 共性 和 变异 ,整理 出 语义 成 分 和 句法 成 分 
在 配 位 关系 上 的 标记 模式 (markedness model) .Q 从 而 ,在 世界 语言 


的 普遍 性 和 差异 性 的 可 能 范围 这 种 广阔 的 背景 上 ,来 重新 认识 汉语 ， 


的 结构 特点 。 更 进一步 ,引进 语法 化 (grammaticalization) 这 种 动态 
性 的 概念 ,2 来 审视 语法 .语义 和 语 用 这 三 个 平面 之 间 的 互动 关系 。 
特别 关注 不 同 语言 中 的 有 关 语 义 和 语 用 因素 是 怎样 用 语法 形式 来 进 
行 组 织 和 编码 的 。 这 样 ,就 可 以 既 从 共 时 角度 出 发 ,考察 一 种 语义 、 
语 用 现象 怎样 被 语法 形式 进行 编码 ;又 从 历时 的 角度 出 发 ,考察 语法 
形式 的 起 源 及 其 虚 化 途径 。 从 而 打破 共 时 研究 和 历时 研究 之 间 的 藩 
篇 ,把 语言 的 共 时 研究 和 历时 研究 沟通 起 来 ;彻底 肃清 索 绪 尔 划分 语 
言 研 究 的 共 时 平面 和 历时 平面 所 带 来 的 消极 影响 ,推动 语言 研究 走 
向 更 为 全 面 、 综 合 和 多 层面 互动 的 道路 。 


四 比如 ,Comrie (1981) Limgwistic UmiversaL azad 工 a2SUQS8e yzo1og? ,通过 路 语言 
调查 发 现 : 选择 语义 上 的 施 事 和 语 用 上 的 话题 作 主 语 是 一 种 语言 普遍 现象 。 详 见 中 译本 
《语言 共性 和 语言 类 型 } 第 13 页 , 沈 家 迷 译 , 华 夏 出 版 社 ,1989 年 。 另外 , 沈 家 迷 (1999) 对 
于 汉语 语法 中 的 有 关 标记 模式 进行 了 探讨 ,值得 参考 。 

加“ 详 见 Heine，Claudi and Hunnemeyer (1991) ，Hopper and Traugott〈1993) 和 
Bybee，Perkins and Pagliuca(1994) 等 。 
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4 语法 和 语音 的 互动 关系 的 初步 探索 


在 汉语 研究 中 ,学 者 们 较 早 地 认识 到 语音 和 语法 有 互相 制约 的 
作用 。 比 如 , 林 者 (1957) 分 别 考 察 了 现代 汉语 趋向 补 语 、 可 能 补 语 、 
程度 补 语 和 少数 结果 补 语 中 轻 音 现 象 所 反映 的 语法 和 语义 问题 ,发 
现 语音 格式 的 不 同 对 语法 和 语义 有 直接 的 影响 。 例 如 :@ 


(1) a. 想 了 很 久 , 我 才 想 。 起 。 来 了 。( 趋 向 补 语 一 一 引 
申 意义 ) 
b. 天 气 不 早 , 我 想起 。 来 了 。 (主要 动词 ) 
《2) a. 日 子 隔 得 太 扩 ,我 想 。 不 起 来 了 。( 可 能 补 语 一 一 
引申 意义 ) 
b. 今天 我 有 点 不 舒服 ,我 想 不 起 *。 来 了 。( 主 要 动词 ) 
在 上 例 中 ,词语 序列 “ 想 (不 ) 起 来 ”是 靠 着 不 同 的 轻 音 现 象 来 分 别 它 


们 的 语法 作用 和 意义 的 (第 4 页 )。 再 比如 * 死 , 开 、 到 、 着 ”等 由 于 语 
法 作用 和 语音 不 同 , 每 个 词 至 少 具有 三 种 不 同 的 意义 。 例 如 ; 


《3) 动词 非 轻 音 补 语 轻 音 补 语 
他 死 了 看 死 了 乐 " 死 了 
开门 了 想 开 了 走 " 开 了 
到 北京 想到 了 提 “。 到 你 
火 着 了 买 着 了 打 。 着 了 


关于 这 些 具 有 对 立 价值 的 例子 , 林 先 生 富有 洞察 力 地 指出 : 


动词 和 非 轻 音 补 语 在 意义 上 的 不 同 决定 于 语法 作用 的 不 
同 , 非 轻 音 补 语 和 轻 音 补 语 在 意义 上 的 不 同 决定 于 声音 的 不 同 : 
这 种 现象 最 足以 说 明 语 音 和 语法 以 及 语义 之 间 的 密切 关系 ,也 
正 可 以 提醒 我 们 绝对 不 能 把 语言 的 这 三 方面 伸 裂 开 来 孤立 地 进 
行 研究 。 (第 21 一 22 页 ) 


Q 在 汉字 前 面 加 ”。 ”号 表示 轻 音 。 
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林 寿 (1962) 指 出 ,研究 一 种 语言 的 句法 结构 , 主要 是 从 词 和 词 之 
间 的 结构 关系 和 人 手 。 这 种 结构 关系 有 时 能 从 语音 现象 中 (包括 语音 
的 停顿 高低、 轻重 等 ) 反 映 出 来 (第 23 页 )。 基 于 这 样 的 认识 ,他 对 
现代 汉语 轻 音 和 句法 结构 的 关系 进行 了 更 全 面 的 考察 。 根 据 分 布 和 
功能 ,他 把 普通 话 的 轻 音 分 为 两 类 : 语调 轻 音 和 结构 轻 音 。 语 调 轻 
音 跟 相关 上 下 文中 的 语调 重音 相对 立 ,表示 不 同 的 语气 , 跟 语 言 的 结 
构 层 次 没有 直接 的 关系 。 例 如 :了 
(4) a。 他 。 是 学 生 。 (一 般 叙 述 ) 

b. 他 ' 是 学 生 。( 我 的 看 法 并 不 错 ) 

c. 他 "是 学 生 ! (你 别 以 为 他 不 是 学 生 ) 
三 句 话 结构 完全 相同 ,是 ”的 三 种 读 法 只 是 表达 了 三 种 不 同 的 语气 。 
结构 轻 音 跟 语言 结构 或 意义 关系 密切 ,在 同样 的 上 下 文中 一 般 没 有 
重音 跟 它 对 立 。 比 如 ,上 文 的 例 (1)(2)。 再 如 : 


(5) a.。 刚 安静 了 一 会 儿 ， 你 们 又 说 。 开 了 。 
b. 事情 说 开 了 ,咱们 俩 心里 也 就 痛快 了 。 


其 中 的 “说 开 ” 的 语音 和 意义 都 是 不 同 的 。 结 构 轻 音 具 有 后 附 性 的 特 
点 , 它 可 以 帮助 我 们 确定 语言 的 结构 层次 。 例 如 : 


(6) a. 他 。 的 | 书 一 b. * 他 | 的 书 一 c. #< 他 |。 的 | 书 
(7) a。 住 在 北京 \ 生 。 在 一 九 六 二 年 \. 跑 ”到 屋 里 、 写 。 
到 了 晚上 十 二 点 
b. 放 。 下 书包 、 哆 。 进 屋 里 去 `、 借 。 来 一 本 书 
c.。 送 。 给 你 \ 借 。 给 他 、 借 "给 一 个 人 


林 先 生 指 出 ,在 分 析 语法 层次 时 ,除非 有 特殊 的 理由 ,不 应 该 把 由 结 
构 轻 音 构 成 的 语音 层次 任意 打 乱 。…… 像 “ 们 、` 的 `. 地 、 得 了 、 着 .过 ” 
等 语法 成 分 永远 轻 读 , 正 是 划分 层次 的 标志 (第 36 页 )。 因 此 ,(6a) 
这 种 分 析 最 合理 。 考 虑 到 轻 音 在 语法 结构 中 的 作用 ， 动 词 十 在 /到 / 
给 ”应 该 分 析 为 一 个 直接 成 分 ,其 结构 关系 跟 * 动 词 十 下 / 进 / 来 "一 


@ 在 汉字 前 面 加 ″“ ”号 表示 一 般 重音 ,加 “” 号 表示 强调 重音 。 
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样 ,是 述 补 结构 (第 40 页 )。 至 于 “ 院 。 里、 墙 上 、 年 。 下 ”等 “名 词 
十 方位 词 ? 结 构 ,考虑 到 其 语音 、 意 义 和 结 构 的 各 个 方面 ,不 应 该 分 析 
成 偏 正 结构 ,而 是 可 以 看 成 是 名 补 结构 (第 44 一 48 页 ) 。 这 种 对 轻 读 
成 分 的 附着 现象 (clitics) 及 相关 结构 的 研究 ,理论 语言 学 界 大 概 是 在 
Zwicky 〈1977) 之 后 才 被 重视 和 得 到 广泛 的 研究 ,并 形成 苦 为 大 观 
的 形态 句法 学 (morphosyntax) 的 。 
更 难能可贵 的 是 , 林 春 (1962: 27 一 29) 在 考察 轻 音 在 语音 结构 
中 的 地 位 时 发 现 : 
上 声 在 一 般 轻 音 之 前 只 读 成 <* 半 上 ?[21], 它 后 面 的 轻 音 音 
高 是 L4] ,两 个 音节 恰好 共同 构成 一 个 全 上 声 的 调 值 [214]。 去 
声 在 轻 音 之 前 只 读 成 [53]( 或 L52])， 它 后 面 轻 音 音 高 是 [1], 两 
个 音节 恰好 共同 构成 一 个 全 去 声调 值 L51]。 这 种 变化 不 只 能 说 
明 轻 音 在 语音 结构 中 的 地 位 ,而 且 也 可 以 看 出 汉语 声调 的 调 值 
有 超出 一 个 音节 的 范围 而 把 后 面 轻 音 音 节 包 括 进去 的 趋势 。 
第 一 个 上 声音 节 有 时 可 以 仍 根据 后 面 轻 音 原 来 的 声调 来 变 
调 , 有 时 又 可 以 不 管 后 面 轻 音 音 节 , 直 接 和 轻 音 后 面 的 其 他 音节 
发 生变 调 关 系 。 例 如 : 
〈8) a、 你。 们 b. 你 好 忆 你 2 人 们 季 
买 “ 守 买 米 买 (4 河 米 
a 栏 的 第 一 个 音节 在 轻 音 字 前 ,所 以 读 半 上 jb 栏 的 第 一 个 
音节 在 上 声 字 前 ,所 以 读 阳 平 ; 
c 栏 的 轻 音 之 后 跟着 一 个 上 声 字 ,第 一 音节 可 以 读 半 上 ,也 
可 以 读 阳 平 人 和 普通 话 三 音节 连续 快 读 时 ,如 果 第 一 音节 是 
阴平 或 阳平 ,第 二 音节 是 阳平 , 则 第 二 音节 可 以 变调 读 阴 平 。 
二 第 三 音节 是 轻 音 时 .…… 第 二 音节 都 不 变调 …… 如 果 轻 音 音 
节 之 后 紧 跟 着 另 一 个 有 声调 音节 同时 快 读 时 , 则 第 二 音节 仍然 
可 以 变调 。 例 如 : 
(9) a. 非常 。 的 好 /feis changs5 de hao214/-> 
/ feiss chang55 de hao214/ 
b. 说 服 。 了 人 /shuoss fuss le rens5 /一 > 
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/ shuoss fuss le renss / 

而 且 轻 音 的 音 高 也 上 升 接 近 [5]。 这 说 明 我 们 在 说 这 向 话 时 ,已 

经 倾向 把 这 个 轻 音 音节 和 它 前 面 的 音节 看 成 共有 一 个 调 值 了 。 
众所周知 ,从 Goldsmith (1976) 提出 自主 音 段 音 系 学 (autosegment 
phonology) 理 论 以 后 ,许多 语言 学 家 很 坚决 地 相信 : 声调 是 一 种 独 
立 于 它 所 搭乘 的 音 段 的 自主 音 段 (autosegment) .@ 于 是 , 像 吴语 等 
汉语 南部 方言 中 连 读 变调 (tone sandhi) 时 强 读 音节 的 声调 保持 并 扩 
散 到 整个 变调 域 (sandhi domain) 的 现象 ,就 可 以 用 弱 读 音节 的 声调 
删除 和 强 读音 节 的 声调 扩散 和 连接 到 其 他 音节 上 等 观念 来 描写 和 和 解 
释 。 没 想到 林 帮 (1962) 在 讨论 以 北方 官话 为 底子 的 普通 话 时 ,已 经 
涉及 这 种 现象 ,并 正确 地 概括 为 “汉语 声调 的 调 值 有 超出 一 个 音节 
的 范围 而 把 后 面 轻 音 音节 包括 进去 的 趋势 ”第 27 页 ) 和 "这 说 明 我 
们 在 说 这 和 句 话 时 ,已 经 倾向 把 这 个 轻 音 音节 和 它 前 面 的 音节 看 成 共 
有 二 个 调 值 了 ”( 第 29 页 ) 。 遗 憾 的 是 没有 人 能 以 此 为 观察 和 思考 的 
起 点 ,演绎 出 类 似 形 态 句法 学 .自主 音 段 音 系 学 那 种 具有 解释 性 和 普 
遍 性 的 语言 学 理论 。 说 起 来 大 有 令 人 扼腕 之 感 ,个 中 原因 谅 非 三 言 
两 语 所 能 道明 ,在 此 姑且 按 下 不 表 。 

虽 坡 湘 (1963) 考 察 了 现代 汉语 单 双 音节 词 的 语法 功能 的 差异 问 
题 ,发 现 : 在 现代 汉语 中 ,(i) 单 音 成 分 的 活动 是 常常 受到 一 定 的 限 
制 的 。 因 此 ,经 常 通过 附加 没有 多 少 意义 (失去 原 有 意义 ,没有 对 立 、 
区 别 作用 ) 的 “ 老 、 小 . 子 , 儿 、 头 ”方位 词 . 或 同 义 并 列 . 重 琶 等 构 词 手 
段 ,来 造成 双 音 词 。 例 如 : 


(10) 老虎 一 小 老虎 “小偷 
一 # 大 偷 石头 心里 衣服 灯火 星星 


(ii) 在 三 音节 和 四 音节 的 语音 段落 里 ,有 单 音节 和 双 音 节 的 搭配 问 
题 。 例 如 : 


(11) 进行 调查 一 * 进行 查 “管理 图 书 一 #* 管理 书 


@ 详 见 Bao (1999) ，p. 5 一 7; Chen 〈2000)，Pp. 57 一 63. 
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人 钢铁 生产 一 xx 人 钢 生 产 
伟大 人 物 一 * 伟 大 人 一 伟大 的 人 
强大 的 国家 一 * 强 大 的 国 


其 中 , 虽 先 生 特 别 敏 锐 地 发 现 : 三 音节 的 语音 段落 , 偏 正式 合成 词 ,2 
十 1 式 ( 动 物 学 .示意 图 ) 比 1 十 2 式 (副作用 、 手 风 和 琴 ) 要 多 得 多 ; 动 宾 
组 合 ,1 十 2 式 ( 买 东西 、 写 文章 ) 多 于 2 十 1 式 ( 吓 路 人 、 糟 踢 钱 ) 。 至 
于 其 中 的 原因 , 吕 先 生 说 : 前 者 跟 在 前 或 在 后 的 单字 的 性 质 和 可 以 
这 样 用 的 单字 的 数量 有 关系 ,后 者 跟 常 用 动词 中 单 音 的 较 多 有 关系 ; 
不 过 ,他 都 极为 谨慎 地 指出 : 是 否 完全 由 于 这 个 因素 ,还 需要 进一步 
分 析 。 二 十 多 年 后 , 吴 为 善 (1986 .1987、1989) 和 陆 丙 甫 (1989) . 张 国 
宪 (1989) 等 继 其 余 绪 ,进一步 探讨 汉语 音节 组 合 的 规律 及 其 背后 的 
原因 。 其 中 , 吴 为 善 (1986) 指 出 : 最 常用 的 动词 大 多 为 单 音节 ( 约 
70%) 名词 大 多 为 双 音节 ( 约 85%%) ,使 得 由 它们 构成 的 动 宾 结 构 大 
多 为 1 十 2 的 模式 。 他 还 很 好 地 得 出 了 较 具 概括 性 的 结论 : 词语 拱 
配 的 选择 性 ,除了 语法 上 和 语义 上 的 制约 ;还 有 语音 方式 上 的 限制 。 
但 是 ,他 没有 说 明 为 什么 三 音节 的 名 词性 偏 正 结构 大 多 为 2 十 1 模 
式 。 这 个 问题 在 吴 为 善 (1989) 中 也 许可 以 找到 一 定 的 解释 ; 三 音节 
段 的 动 宾 结构 在 意义 上 都 是 两 个 概念 的 组 合 ( 运 粮 食 、 缝 衣服 ) ,它们 
之 间 的 关系 较 松 ;而 偏 正 结构 实际 上 相当 于 一 个 复合 词 ( 象 牙 簧 、 防 
风 镜 ) ,它们 大 多 是 一 些 事物 的 名 称 ,表示 的 只 是 单个 的 概念 ,内 部 比 
较 紧 密 。 其 他 学 者 的 发 音 和 听 辩 实验 也 证 明 : 在 1 十 2 中 ,前 面 的 单 
音节 跟 后 面 的 双 音 节 结 合 较 松 ; 在 2 十 1 中 ,后 面 的 单 音节 跟前 面 的 
双 音 节 结 合 很 紧 。 他 由 此 得 出 推论 : 后 置 单 音节 具有 粘 附 性 ,前 置 
音节 具有 相对 独立 性 。 并 作出 更 为 大 胆 的 设想 : 一 定 的 语义 、 语 
法 组 合 总 是 选择 适当 的 语音 组 合 形式 ,使 两 者 一 致 起 来 ,就 像 在 三 音 
节 段 里 , 动 宾 往 往 选择 1 十 2, 而 偏 正 往 往 选择 2 十 1。 陆 丙 甫 (1989) 
尝试 用 结构 (汉语 是 核心 在 后 结构 占 优势 ) .节奏 (汉语 三 音节 是 1 十 
2 优 于 2 十 1) .松紧 (核心 在 后 结构 紧 于 核心 在 前 结构 ) .轻重 (有 无 轻 
读音 节 ) 等 概念 ,来 解释 为 什么 汉语 中 某 些 格式 是 不 合格 的 。 张 国 宪 
《1989) 则 专门 考察 “ 动 十 名 ”结构 中 单 双 音 节 动 作 动词 功能 的 差异 ， 
特别 是 构成 三 音节 和 四 音节 组 合 时 ,其 结构 关系 ( 动 宾 还 是 偏 正 ) , 动 
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词 和 名 词 之 间 在 音节 、 语 义 等 方面 的 选择 限制 。 应 该 说 是 有 了 一 个 
良好 的 开端 ,可 惜 的 是 这 种 研究 大 都 比较 零碎 、 缺 少 系 统 性 ,也 没有 
联系 现代 音 系 学 和 现代 各 种 相关 的 句法 理论 ;因此 , 热 阅 了 一 阵子 之 
后 , 便 难以 为 继 , 只 得 沉寂 下 去 。 


5 语法 和 语音 的 互动 关系 的 系统 研究 


对 汉语 中 语法 和 语音 之 间 互 动 关 系 的 较为 系统 一 点 的 研究 ,是 
在 生成 语法 和 生成 音 系 学 的 理论 背景 上 展开 的 。 并 且 , 呈 现 出 明显 
的 不 对 称 性 ;表现 为 : 关于 语法 对 语音 的 制约 作用 的 研究 较为 充分 ， 
而 关于 语音 对 语法 的 制约 作用 的 研究 尚 嫌 薄 弱 。 具 体 地 说 ,由 于 汉 
语 是 一 种 有 声调 的 语言 (tonal ljanguage) ,并 且 汉语 各 方言 都 有 声调 
在 特定 的 上 下 文 语 境 中 的 读音 变化 (tonal alternation) 现象 , 即 连 读 
变调 (tone sandhi) 。 严 格 地 说 , 连 读 变调 是 一 种 发 生 在 词 或 语素 的 
交接 处 的 “语素 一 声调 音 位 ?变化 (morphotonemic alternation); 它 有 
时 不 能 单纯 从 语音 条 件 上 作出 描写 ,而 是 要 联系 到 相关 的 形态 条 件 
或 句法 条 件 .甚至 是 语义 和 语 用 条 件 。 其 中 ,最 著名 的 是 连 读 变调 的 
范围 ( 即 变 调 域 ,sandhi domain or scope) 问 题 。 众 所 周知 , 跟 绝 大 多 
数 的 局 限于 一 处 的 音 段 现象 不 同 ,声调 的 作用 范围 是 长 距离 的 ,有 时 
甚至 横 跨 整个 短语 或 句子 。 于 是 ,要 想 准 确 地 界定 变调 域 , 就 必然 会 
引起 诸如 音 系 和 语法 结构 的 关系 等 有 趣 的 问题 .了 比如 ,在 浙江 汤 
溪 话 中 ,短语 和 合成 词 的 重音 (stress) 位 置 不 同 , 从 而 造成 了 不 同 的 
连 读 变 调 的 结果 。 例 如 : 从 本 调 来 看 “ 炒 ? 是 降 调 CHL)， 饭 ?是 升 
调 (LH) 。 当 这 两 个 语素 组 成 动 宾 短 语 时 ,重音 在 宾语 “ 饭 ” 上 ， 炒 ” 
的 声调 删除 ; 当 这 两 个 语素 组 成 偏 正 合 成 词 时 , 重音 在 修饰 语 “ 炒 ” 
上 ,中心 语 “ 饭 ”的 声调 删除 ,并 且 ”“ 炒 ”的 声调 扩散 (Cspread) 到 “ 饭 ” 
上 。 上 海 话 中 “炒饭 ”的 情况 与 此 相似 , 作 偏 正式 合成 词 时 ， 饭 ”的 声 
调 (LH) 删 除 ,* 炒 ”的 声调 (MH) 系 联 Cassociation) 到 “ 饭 ” 上 ; 作 动 宾 
短语 时 ,可 以 保持 本 调 不 变 , 或 者 “ 炒 ” 的 声调 简化 Csimplification ) 为 


d 参考 Chen (2000) 的 Preface，p. xi，xiii。 
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H。 值 得 注意 的 是 , 汤 溪 话 中 的 变调 规则 主要 是 直接 跟 形态 一 句法 
结构 (morphosyntactic structure) 相 联系 的 ,表现 为 : 在 一 个 短语 中 ， 
只 有 最 右边 的 词 的 起 首 音 节 保 留 其 原 有 的 词汇 声调 并 向 右 扩 散 到 整 
个 组 合 。 上 海 话 的 情况 比 汤 溪 话 复杂 ,是 以 重读 音 步 (stress-foot) 这 
种 节律 (metrical) 单 位 为 连 读 变调 域 的 。 尽 管 如 此 ,上 海 话 的 节律 组 
织 还 是 跟 形 态 一 句法 直接 相关 的 。 比 如 ,端木 三 的 一 系列 研究 显示 
上 海 话 的 节律 规则 在 语素 、. 词 /合成 词 .短语 三 个 平面 上 是 不 同 的 .O 
这 说 明 像 连 读 变调 等 语音 现象 不 仅 不 是 无 视 句 法 的 (syntax-blind) ， 
而 且 有 时 是 句法 敏感 的 (syntax-sensitive) 。 于 是 ,在 描写 语音 现象 、 
总 结 变调 域 等 音 系 规则 时 ,就 不 可 避免 地 要 用 到 许多 句法 学 的 概念 ， 
甚至 是 一 些 极为 抽象 的 句法 概念 。 比 如 ,在 描写 丹阳 话 的 变调 域 时 ， 
端木 三 用 基于 重音 的 节律 分 析 法 (stress-based metiical analysis) ; 
而 张 洪 明 则 沿 着 基于 句法 的 路 子 (syntax-based approach), 用 成 分 
统制 (ccommand) 这 种 抽象 的 概念 来 定义 变调 域 :@ 


a 向 右 扩 散 到 B, 当 且 仅 当 B 被 wu 成 分 统制 。 


众所周知 ,当代 生成 语法 的 有 些 句法 概念 是 极其 抽象 的 ;有 时 ， 
用 这 种 过 于 抽象 的 句法 概念 来 描写 音 系 规 则 ,会 掩盖 音 系 限 制 条 件 
背后 的 动因 (motivation) 。 比 如 ,南通 话 的 韵律 组 织 (rhythmic or- 
ganization) 基 本 是 依赖 于 结构 的 (structure-dependent)。 因 此 ,同样 
是 四 个 音节 ,“( 红 十 字 ) (会 )” 是 两 个 音 步 \ 两 个 变调 域 ,“( 波 里 )( 维 ) 
〈 亚 ) "是 三 个 音 步 、 三 个 变调 域 。 之 所 以 不 同 , 都 有 结构 上 的 原因 。 
但 是 又 不 能 简单 地 说 直接 成 分 (IC) 必须 属于 同一 音 步 。 因 为 ,存在 
着 ”( 红 十 )( 字 )”( 两 个 音 步 、 两 个 变调 域 ) 这 种 不 顾 直 接 成 分 结构 的 
韵律 组 织 。 为 了 解决 这 个 矛盾 , 歼 小 平 提出 了 下 列 十 分 笨拙 的 规定 : 


@ 详 见 Chen (2000)，p. 297 一 299,p. 306 一 316,pD. 88 。 

Q@ 详 见 Chen (2000) ，p. 331 一 335 。 更 全 面 地 说 , 张 洪 明 (1992 : 224) 指 出 ,变调 域 
是 由 成 分 统制 和 论 旨 关系 (thematic relation) 决 定 的 。 有 关 的 评论 请 看 Duanmu (1995) ， 
p. 228 一 229。 
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语素 完整 性 限制 (Morpheme Integrity Constraint) : 
一 个 管辖 Cdominate)a 和 有 的 音 步 ,管辖 所 有 成 分 统制 B 且 
不 成 分 统制 w 的 y, 如 果 7 在 一 个 可 以 成 为 音 步 的 8 之 前 。 


这 里 的 w，B，y，8 指 一 个 线性 的 音节 序列 ,比如 “ 红 十 字 会 ”。 显 然 ， 
这 种 限制 用 了 复杂 的 关于 成 分 统制 关系 的 规定 ,其 实 是 专门 为 了 能 
够 说 明 “ 红 十 字 会 > 一 类 前 律 组 织 , 同 时 又 绕 过 “ 红 十 字 ” 这 种 违背 直 
接 成 分 结构 的 韵律 组 织 。 至 于 这 种 限制 背后 的 动因 是 不 清楚 的 。 相 
反 , 陈 渊 泉 为 此 提出 了 具有 独立 动因 的 原则 


不 要 骑 跨 (No Straddling) : 
直接 成 分 必须 是 一 个 音 步 之 中 的 伙伴 (IC must be foot- 


mates) 。 


至 于 “ 红 十 字 ” 的 韵律 组 织 违背 这 一 限制 依然 成 立 的 原因 是 ,其 他 可 
能 的 韵 律 组 织 将 违背 更 多 或 更 重要 的 限制 ;根据 优选 论 (optimality 
theory) ,采纳 目前 这 种 韵律 组 织 虽 然 是 美中不足 ,但 相 比 之 下 仍 是 
最 优 的 .9 
特别 有 意思 的 是 , 闪 律 组 织 有 时 会 直接 受到 语义 . 语 用 因素 的 影 

响 。 比 如 , 张 正 生 和 五 基 琳 曾经 分 别 指出 ,说 话 人 往往 会 通过 在 一 个 
成 分 之 前 放置 一 个 强调 边界 (emphatic boundary, 记 作 !1) ,来 标志 这 
个 成 分 处 于 焦点 或 对 比 地 位 。 这 种 边界 就 像 是 语调 短语 (intonation 
phrase, 记 作 IP) 边 界 , 成 为 音 步 组 织 的 一 个 新 的 参照 点 。 于 是 ,通常 
的 韵律 组 织 可 以 给 出 一 个 无 标记 的 解读 (reading), 有 由 语 用 决定 的 
强调 和 对 比 标记 的 韵律 组 织 给 出 一 个 有 标记 的 解读 。 例 如 

(1) 只 [5 买 股票 ], 不 [ 卖 股票 ]。 

593 ee 

本 《324 《Cs 3 47 
其 中 ,s 代表 从 第 三 声 通过 连 读 变调 而 派生 出 来 的 第 二 声 ,3 表示 第 
三 声 ,4 表示 第 四 声 。(1a) 是 无 标记 的 解读 , (1b) 是 有 标记 的 解读 。 


@ 详 见 Chen (2000) ，p. 356 一 360 。 
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韵律 结构 和 语法 结构 之 间 的 互动 关系 ,在 这 里 表现 得 可 谓 淋漓 尽 致 。 
Chen 〈2000: 404) 为 北京 官话 (Beijing Mandarin) 的 变调 域 所 受到 
的 制约 因素 排列 成 如 下 这 种 层级 序列 : 


{ 不 要 骑 跨 ,语调 短语 界限 } 盖 { 二 元 性 } 
{ 有 限 性 } 六 (一致 性 } 盖 { 从 左 向 右 } 


因为 ,话语 首先 划分 成 语调 短语 ,然后 音节 在 语调 短语 的 范围 内 组 合 
成 最 小 的 韵律 单位 Cminimal rhythmic units, 简称 MRUs)。 这 种 
MRUs 成 为 强制 性 的 连 读 变调 域 。 所 以 ,语调 短语 界限 和 保持 直接 
成 分 在 一 个 音 步 之 内 的 不 要 骑 跨 是 最 优先 的 限制 。 二 元 性 要 求 一 个 
MRUs 最 少 有 两 个 音节 ,有 限 性 则 要 求 一 个 MRUs 最 多 只 能 有 两 个 
音节 。 一 致 性 要 求 组 成 一 个 MRUs 的 成 员 是 形态 一 句法 上 关系 紧 
密 的 伙伴 ,以 保证 韵律 跟 句法 的 和 谐 。 从 左 向 右 说 的 是 组 织 MRUs 
的 方向 和 顺序 .9 由 于 语调 短语 的 界限 有 时 要 受到 语 用 的 影响 (如 
1b 所 示 ) ,因而 上 述 六 个 限制 条 件 中 ,竟然 有 三 项 是 跟 语法 (包括 语 
义 和 语 用 ) 相 关 的 。 语 法 对 语音 的 制约 关系 , 在 这 里 得 到 系统 而 清 
晰 的 反映 。 

至 于 语音 对 语法 的 制约 关系 ,就 没有 这 人 么 直接 和 系统 了 。 根 据 
Bloomfield 〈1933: 163 一 165) ,一 个 语言 中 形式 的 有 意义 的 配置 方 
式 Cmeaningful arrangements) 构 成 了 这 语言 的 语法 。 语 言 形 式 的 配 
置 有 四 种 方式 : 〈a) 次 序 (Corder) ,比如 ,John hit Bill 不 同 于 Bill hit 
John,Bill John hit 则 不 是 英语 的 句子 形式 ;(b) 节 律 (modulation ) ， 
比如 John. ”“John!1”“John?” 通 过 语调 音 高 变化 来 表示 陈述 、 回 
答 .疑问 等 意义 差别 ;(c) 语 音 改变 (phonetic modification), 比如 ， 
run ~ ranykeep 一 kept; (d) 选 择 (Cselection) , 比如 ,drink milk 一 
watch John,fresh milk ~ poor John ,John runs fast ~ the boys run 
fast, 这 种 搭配 不 能 任意 替换 。Chao (1968) 指出 : 这 四 种 方式 在 汉 
语 语法 里 的 作用 有 大 有 小 。 在 近代 汉语 里 ,节律 和 语音 改变 的 作用 
不 太 重 要 ,次序 和 选择 在 语法 安排 上 起 主要 的 作用 。…… 节律 指 轻 


@ 详 见 Chen (2000)，p. 371 一 372，380，404。 
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重 、 停 顿 .语调 等 方面 的 差别 ( 吕 译 本 第 9 页 ) 。 的 确 , 在 传统 的 结构 
主义 语法 框架 中 , 像 直 接 成 分 之 间 的 结构 关系 、 各 直接 成 分 的 音节 和 
整个 组 合 之 间 的 合格 性 之 间 的 制约 关系 是 不 太 容 易 处 理 的 。 等 到 生 
成 音 系 学 诞生 ,轻重 . 音 步 .韵律 的 冲突 和 消解 (metrical clash and 
resolution) 等 概念 和 相应 的 分 析 方 法 出 现 , 比 较 系 统 的 关于 语音 对 
语法 的 制约 关系 的 研究 终于 有 了 技术 上 的 可 能 性 。 比 如 , 冯 胜 利 
(1997,2000) 等 著作 ,用 韵律 音 系 学 的 理论 和 方法 来 考察 和 分 析 汉 语 
语音 对 语法 的 制约 关系 ,探索 句法 与 韵律 的 相互 作用 的 规律 ,并 尝试 
建立 汉语 韵律 名 法学。 讨论 到 的 问题 包括 : 汉语 的 自然 音 步 是 什 
么 ? 是 怎样 构成 的 ?” 有 没有 必要 在 单 音 节 词 和 句子 之 间 建 立 韵 律 词 
(prosodic word) 这 一 单位 ? 不 同类 型 的 句法 结构 (比如 , 述 宾 结构 
和 偏 正 结构 ) 在 单 、. 双 音节 的 搭配 上 有 什么 限制 条 件 ? 为 什么 ? 能 否 
和 怎样 用 韵律 要 求 来 解释 “把 ”字句 “被 字句、 主题 句 等 句子 中 宾语 
位 置 的 移动 ,动词 之 后 的 介 宾 结 构 中 的 介词 贴 附 在 动词 上 ,历史 上 介 
宾 结 构 位 置 从 动词 后 向 动词 前 的 转移 `SOV 结构 向 SVO 结构 的 转 
移 、 以 及 “被 ”字句 和 “把 ”字句 的 产生 和 发 展 等 历史 句法 问题 ?其 中 ， 
比较 引人入胜 的 是 希望 用 音 步 .轻重 及 其 造成 的 韵律 格式 等 概念 来 
解释 下 列 不 平行 的 现象 : 


(2) 种 植 花草 一 关 种 植 花 / 草 一 种 花草 一 种 花 /和 草 
(3) 阅读 报纸 一 * 阅读 报 一 读 报纸 一 读 报 

(4) 喜欢 钱财 一 喜欢 钱 一 爱 钱 财 一 爱 钱 

(5) 皮 灶 工厂 一 皮鞋 厂 一 * 鞋 工厂 一 鞋 厂 

(6) 煤炭 商店 一 煤炭 店 一 关 煤 商 店 一 煤 店 


如 果 假 设 在 韵律 上 双 音 节 比 单 音 节 重 或 突出 ,或 者 说 较 重 的 成 分 采 
用 较 长 的 词 形 ;并 且 , 相 信 重 音 由 句法 关系 决定 ,那么 就 可 以 引入 一 
条 辅 重 原 则 (Non-Head Stress principle，NHS) : 在 韵律 上 ,辅助 成 
分 ( 即 非 核心 成 分 ,包括 论 元 和 附加 成 分 ) 应 该 比 核心 成 分 更 重 , 更 突 
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出 Cprominent); 于 是 ,上 述 现 象 就 比较 容易 解释 :2 述 宾 结 构 的 核心 
是 述 语 ,辅助 成 分 是 宾语 ;因此 , 述 宾 结 构 在 韵律 上 应 该 是 抑 扬 格 (i- 
ambus) 。 于 是 ,1 十 2 式 的 述 宾 结构 符合 抑 扬 格 这 种 韵律 限制 ,而 2 
十 1 式 是 扬 抑 格 (trochaics) ,不 符合 述 宾 结 构 的 韵律 要 求 。 至 于 “ 嘉 
欢 ” 的 “ 欢 ” 是 个 轻声 字 ,整个 双 音 节 词 是 一 个 打 了 折扣 的 残 音 步 (de- 
fective foot) ,其 长 度 跟 单 音节 差不多 ;也 就 是 说 “喜欢 钱 ” 这 类 形式 
不 是 抑 扬 格 ,所 以 并 不 违反 述 宾 结构 的 韵律 限制 .@ 这 是 对 (2) 一 
《4) 的 解释 。 至 于 (5)(6) 是 偏 正 结构 ,根据 辅 重 原则 ,应 该 是 扬 抑 格 ， 
所 以 1 十 2 式 不 符合 这 种 韵律 要 求 。 

上 述 这 种 韵律 句法 学 解释 看 上 去 简单 明了 ,又 很 能 说 明 问 题 。 
但 是 ,如 果 像 Lu and Duanmu (1991) 那 样 ,坚持 认为 : 对 词 的 长 度 
的 选择 取决 于 重音 , 带 有 重音 的 词 不 能 比 不 带 重音 的 词 短 ;那么 ,就 
不 足以 解释 吕 叔 湘 (1963) 中 碰 到 的 一 些 问 题 : (1) 偏 正 结构 固然 以 
2 十 1 式 为 主流 ,但 是 1 十 2 式 也 为 数 不 少 ; 述 宾 结 构 固 然 以 1 十 2 式 
为 主流 ,但 是 2 十 1 式 也 为 数 不 少 。 例 如 


《7) 副作用 手风琴 大 面积 小 规模 新 衣服 老 工 人 长 短裤 
《8) 浪费 钱 需要 纸 爱护 人 采购 米 产生 电 答应 去 分 裂 党 
于 是 ,前 述 的 韵律 限制 就 不 像 是 强制 性 的 (obligatory) 了 。 但 也 不 像 
是 任 选 的 (optional) ,因为 有 “ 鞋 工厂 、 种 植 花 ” 等 不 合格 的 形式 存在 。 


OO 汉 胜 利 (2000) 从 “句子 重音 在 句 末 的 最 后 一 个 短语 中 实现 ”这 种 普遍 语法 原则 出 
发 ,来 推导 出 “宾语 永远 比 动 词 强 ”( 第 115 页 ) 。 因 为 汉语 没有 形态 ,动词 没有 定式 (finite) 
和 不 定式 (infinite) 之 别 ; 并 且 , 述 宾 结 构 的 韵律 限制 在 述 宾 结 构 藤 套 进 其 他 词组 中 时 依然 
有 效 (如 : 种 植 花草 的 季节 一 * 种 植 花 的 季节 )。 所 以 ,我 们 完全 可 以 在 词组 平面 上 来 研 
究 词 语 组 合 的 韵律 限制 。 关 于 句法 决定 重音 和 辅 重 原则 , 详 见 Duanmu and Lu (1990)， 
Lu and Duanmu (1991), Duanmu (1990，2000)。Duanmu (1995: 255) 特别 指出 ,根据 
Cinque (1993) ,他 假定 : 短语 的 重音 是 循环 指派 的 ,宾语 的 重音 比 动 词 强 ,谓语 的 重音 比 
主语 强 。Chen (2000: 257,， 491) 也 有 精彩 的 讨论 ,可 以 参看 。Chen (2000: 500) 特 别 指 
出 ,Cinque (1993) 的 普遍 重音 规则 给 出 的 优先 顺序 是 : 补足 语 (Comp) > 核心 (head) > 
指示 语 (Spec) ,Duanmu (1990) 的 辅 重 原则 并 不 区 分 论 元 和 附加 成 分 (adjunct) ;而 他 则 通 
过 汉语 方言 的 例证 给 出 了 这 样 的 可 重读 层级 (stressability hierarchy): 附加 语 (adjunct) 
二 论 元 (argument) 二 核心 (head) 。 

@ 关于 对 ”* 残 音 步 ? 的 分 析 , 详 见 冯 胜 利 (2000) ,第 119 一 120 页 。 
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对 于 “大 苹果 、\ 布 手套 ”一 类 2 十 1 式 偏 正 结构 的 合格 性 , Duanmnu 
(2000) 提 出 了 一 种 解释 : 因为 像 这 里 的 “大 、 布 ?等 在 长 度 上 不 能 变 
通 , 即 它们 没有 同 义 的 双 音 节 形 式 。 我 们 认为 这 种 解释 说 服 力 不 强 。 
比如 ,“ 大 型 苹果 ”固然 是 语义 怪异 ,但 是 “大 号 苹果 .大 的 苹果 大 大 
的 苹果 、 棉 布 手套 \ 布 制 手套 ”等 符合 韵律 要 求 的 同 义 形 式 是 现成 ， 
的 。 我 们 建议 ,可 以 像 Chen (2000: 222,，257，500) 那 样 ,在 辅 重 
原则 NHS 之 外 ,引入 Prince (1990) 提 出 的 分 量 适 合 重音 原 则 
Cweight-to-stress principle，WSP) , 即 重音 落 在 韵律 分 量 重 的 成 分 
上 比 落 在 韵律 分 量 轻 的 成 分 上 更 和 谐 Charmonic) 。 这 样 ,分 量 适 合 
重音 只 是 一 条 优选 论 原则 ,不 具有 强制 性 ;更 何况 实现 韵律 分 量 
重 , 除 了 音节 数量 之 外 ,还 有 拉 长 元 音 等 手段 可 资 利用 。(2) 符合 
句法 .语义 选择 关系 ,并 且 明 明 符 合 韵律 限制 的 格式 反而 是 不 合格 
的 。 例 如 : 


(9) 互相 埋怨 一 关 互相 她 一 互相 咬 
共同 使 用 一 x* 共同 用 一 共同 做 
日 益 增 多 一 # 日益 多 ~? 日 益 少 
(10) 伟大 人 物 ~ 一 * 伟大 人 一 伟大 的 人 
强大 的 国家 一 类 强 大 的 国 
(11) 中 药 西药 一 中 西药 
大 事 小 事 一 * 大 小 事 一 大 小 事务 
(12) 编辑 和 出 版 刊物 一 * 编 和 出 刊物 一 编 刊物 和 出 刊物 


要 解释 这 些 现 象 , 就 需要 我 们 考虑 更 多 的 因素 及 其 复杂 的 相互 作用 
机 制 。 

最 后 ,韵律 句法 学 上 建立 起 来 的 音 步 的 概念 ,应 该 跟 音 系 学 上 关 
于 北京 话 连 读 变调 域 的 音 步 或 最 小 韵律 单位 CMRUs) 进 行 比 较 。 比 
如 , 汉 胜 利 (2000) 提 出 : 一 个 在 韵律 节奏 中 可 以 独立 的 基本 单位 是 
韵律 词 , 韵律 词 是 一 个 最 小 的 语 流 片 段 。 他 相信 MecCarthy 必 
Prince 的 说 法 : 人 类 语言 中 “最 小 的 能 自由 运用 的 韵律 单位 ?是 “ 音 
步 2; 因 此 ,主张 用 音 步 来 确定 韵律 词 。 他 指出 , 音 步 由 音节 组 成 , 韵 
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律 词 则 由 音 步 来 实现 。 为 此 ,他 提出 了 下 列 汉语 音 步 组 成 的 规则 :9 


Ci) 汉语 自然 音 步 的 音节 “小 不 低 于 二 ,大 不 过 三 ”2; 因 此 ， 

《ii) 单 音 节 形 式 不 足以 构成 独立 的 音 步 ,如 : 法 ( 国 )、 美 
〈( 国 ); 

(Ciii) 两 个 音节 组 成 一 个 独立 的 音 步 ,如 : 巴西 古巴 ; 

(iv) 三 个 音节 也 组 成 一 个 独立 的 音 步 ,如 : 加 拿 大 、 墨 西 
可 ; 

Cv) 四 个 音节 必须 分 成 [2#2] 格 式 , 如 : 斯 里 / 兰 卡 、 坦 桑 / 
尼 亚 ; 

Cvi) 五 个 音节 必须 分 成 [2# 3] 格 式 , 如 : 阿尔 / 巴 尼 亚 、 加 
利 / 福 尼 亚 和 … 


汉 胜 利 (1997) 参 照 陈 渊 泉 、 石 基 琳 的 办 法 ,建立 了 划分 句子 音 步 
的 程序 : 

〈i) 先 按 直 接 成 分 分 析 法 切 分 句子 ,如 : 校长 || 想 请 小 王 | 
吃 晚 饭 ; 

ii) 再 从 右 向 左 系 联 各 成 分 中 的 双 音 步 ,如 : (校长 ) | | 想 
请 (小 王 )| 吃 (上 晚饭 ); 

(iii) 剩余 的 单 音 成 分 仍 系 联 成 双 音 步 ,如 : (校长 ) | | ( 想 
请 )( 小 王 )| 吃 (晚饭 ); 

Civ) 不 成 双 音 步 的 单 音 成 分 系 联 到 邻近 的 音 步 上 ,根据 其 
句法 关系 决定 左 附 或 右 附 ; 如 : (校长 )||( 想 请 )( 小 王 )|( 吃 (了 晚 
饭 ))。( 第 23 页 , 注 4) 


这 里 的 音 步 ,说 得 朴素 一 点 儿 就 是 : 最 小 的 两 头 可 以 有 明显 的 停顿 、 
或 短暂 的 间 葡 的 音节 群 。 根 据 我 们 的 体会 ,北京 话 的 连 读 变调 域 也 
是 最 小 的 两 头 可 以 有 明显 的 停顿 .或 短暂 的 间歇 的 音节 群 。 正 因为 
处 于 一 个 音 步 中 的 音节 群 中 的 各 音节 之 间 没 有 间歇 ,所 以 变调 成 了 
一 种 达到 协同 发 音 的 调节 机 制 。 这 样 说 来 , 音 步 或 韵律 词 的 概念 跟 


@ 详 见 冯 胜 利 (2000) ,第 77 一 80.93 一 98 页 ;部 分 叙述 有 改动 ,例子 有 所 增益 。 
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最 小 韵律 单位 C(MRUs) 的 概念 应 该 是 吻合 和 协调 的 .@ 比如 ,Chen 
(2000: 367) 提 出 的 北京 话 的 最 小 韵律 单位 (MRUs) 的 组 织 原 则 是 : 


(i) 二 元 性 ,一 个 MRUs 至 少 是 双 音 节 的 ; 
(ii) 有 限 性 ,一 个 MRUs 至 多 是 双 音 节 的 ; 
(iii) 从 堪 向 右 ,MRUs 是 从 左 向 右 组 织 起 来 的 。 


这 跟 汉 胜利 (2000) 的 音 步 组 成 的 规则 大 致 相似 ,只 是 音 步 组 织 的 方 
向 正好 相反 。.@ 但 是 ,对 一 些 多 音节 组 合 ,根据 冯 胜 利 (1997,2000) 
得 出 的 音 步 划分 ,是 明显 地 不 同 于 其 连 读 变调 域 ( 即 MRUs) 的 。 例 
如 :@ 


(15) 纸老虎 跑 (16) 找 胆 小 鬼 (17) 我 往 北 走 
as 【3:s55139) (C375 瑟 电 《59 (Cs 
3 人 《 和 的 


由 于 汉语 允许 单 音节 构成 一 个 独立 的 退化 音 步 (degenerate foot)， 
因而 从 理论 上 讲 b 种 音 步 组 织 是 合理 的 。 但 是 ,a 这 种 连 读 变调 的 
语音 事实 却 自 成 一 格 ,并 且 有 理 可 循 。 比 如 ;(15) 一 (17)? 的 b 种 读 法 
将 同时 违背 二 元 性 和 有 限 性 两 项 限制 ,(16)b 还 违背 了 从 左 向 右 这 
项 限制 ;而 (15)(16) 的 a 种 读 法 只 违背 有 限 性 一 项 限制 ;(177? 的 a 种 
读 法 只 违背 不 要 骑 蜂 一 项 限制 ,但 介词 “入 ?作为 一 种 附着 成 分 


@@ “Chen (2000: 505) 在 全 书 结语 (concluding remarks) 中 说 : 官话 中 的 最 小 韵律 单 
位 CMRU) 比较 特别 , 它 既 可 以 是 比 词汇 小 的 片段 Csublexical fragment) ,也 可 以 是 整个 词 、 
一 个 短语 、 多 个 小 句 的 结构 (multiclausal construction) ,或 者 甚至 完全 是 一 个 非 结 构成 分 
(Cnon-constituent) 。 因 此 , 它 不 适合 如 下 常规 的 韵律 层级 : { 音 步 (foot), 音 系 词 (phono- 
logicaL-word) ,附着 群 (clitic group) , 音 系 短语 (phonological-phrase) ,语调 短语 (intonation 
phrase)) 但 是 , 它 作为 一 种 特殊 的 韵律 单位 而 独立 存在 。 如 果 有 什么 区 别 的 话 , 作 为 一 
种 诗歌 韵律 分 析 的 单位 ,MRU 可 以 在 音 步 中 发 现 它 自 己 的 最 接近 的 相似 物 。 

@ 心理 语言 学 的 证 据 显 示 , 言 语 组 织 ( 即 音 系 编码 ) 有 从 左 向 右 的 倾向 ;并 且 , 在 把 
音节 组 织 成 音 步 的 时 候 , 也 是 从 左 向 右 占 优势 。 参 见 Chen (2000: 119) 及 其 所 引 的 文献 。 
另外 ,Shih (1986) 也 主张 : 从 左 向 右 把 挂 单 的 音节 (unpaired syllable) 系 联 成 二 元 音 步 ( 即 
双 音 节 音 步 ) ,除非 它们 是 朝 相 反 的 方向 分 枝 的 。 转 引 自 Chen 〈2000: 374) 。 

四 “关于 这 些 组 合 的 连 读 变调 域 及 其 限制 条 件 , 详 见 Chen (2000) Chpt. 9: Minimal 
rhythmic unit as obligatory sandhi domain，Ppp. 369 一 370，400 一 401。 变调 域 显 然 是 跟 音 
步 相关 的 ,比如 Shih (1986) 主张 ,官话 第 三 声 的 变调 域 是 音 步 , 参 见 Duanmu (1995: 2577。 
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(clitics) , 它 必 须 向 左 贴 附 (Ccliticize leftwards) 到 前 面 的 音节 上 一 起 
构成 一 个 语音 词 (phonological word), 这 种 强制 性 的 音 系 学 限制 足 
以 抵 销 不 要 骑 跨 限制 。 面 对 这 种 句法 和 语音 错 配 (syntaxphonology 
mismatch) 现 象 ,我 们 必须 思考 : 韵 律 句 法 学 上 的 音 步 概念 应 该 向 句 
法 倾斜 还 是 向 语音 倾斜 ? 说 到 底 ,应 该 怎样 既 有 助 于 说 明 句 法 问题 ， 
又 在 一 定 程度 上 照顾 到 语音 现实 ? 


6 词 库 结构 和 句法 操作 的 互动 关系 


在 传统 的 语言 研究 中 ,人 们 相信 : 语法 是 语言 的 结构 规律 ,词汇 
是 语言 的 建筑 材料 。 因 此 ,在 语法 学 中 并 没有 词汇 的 地 位 。 到 了 生 
成 语法 时 代 , 语 言 学 家 以 探究 人 类 语言 知识 的 组 织 方式 并 为 之 建立 
理论 模型 为 已 任 , 语 法 研究 的 对 象 扩大 为 整个 的 人 类 大 脑 中 的 语言 
知识 。 于 是 ,语法 除了 包括 其 核心 内 容 句 法 之 外 ,还 包括 词汇 \ 语 义 
和 语音 。 比 如 ,Chomsky 1965) 认 为 语法 有 句法 .语义 、 音 系 三 个 组 
成 部 分 。 其 中 ,句法 部 分 包括 短语 结构 规则 和 转换 规则 ,短语 结构 规 
则 和 词 库 (lexicon) 构 成 句法 的 基础 部 分 。 把 取 自 词 库 的 词 项 插入 表 
示 短 语 结构 的 树 形 图 就 得 到 句子 的 深层 结构 ,再 输出 到 语义 部 分 就 
得 到 句子 的 语义 表达 式 。 对 深层 结构 进行 转换 操作 就 得 到 句子 的 表 
层 结构 ,再 输出 到 音 系 部 分 就 得 到 音 系 表达 式 。 这 就 是 所 谓 的 标准 
理论 。 到 了 修正 的 扩充 式 标 准 理论 , 改 为 表层 结构 同时 向 音 系 部 分 
和 语义 部 分 输出 , 词 库 和 短语 结构 规则 的 关系 则 没有 改变 。 既 然 词 
项 是 短语 结构 规则 的 输入 ,那么 词 项 之 间 的 搭配 和 组 合 信息 越 详 细 、 
越 具 有 结构 性 就 越 有 利于 说 明 句 法 组 合 的 合格 性 问题 。 比 如 ,动词 
能 不 能 带 宾语 ,能 带 几 个 宾语 。 进 一 步 的 要 求 就 是 : (i) 动词 能 跟 几 
个 名 词性 成 分 发 生 名 法、 语义 联系 ,这 就 是 配 价 语法 研究 的 主题 ; 
〈ii) 这 些 名 词性 成 分 相对 于 动词 分 别 充当 了 什么 语义 角色 、 在 表层 
结构 中 分 别 能 充当 什么 语法 角色 ,这 就 是 格 语法 的 核心 内 容 。 
Chomsky (1982) 所 建立 的 GB 理论 ,已 经 很 好 地 把 这 种 知识 作为 记 
载 在 词 库 中 的 动词 词 条 之 下 的 词汇 .语义 特征 ;还 假定 : 一 个 动词 所 
必 备 的 论 元 构成 了 动词 的 论 元 结构 (argument structure) ,基础 句 式 
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是 动词 的 论 元 结构 的 一 个 投影 。 在 此 基础 上 ,建立 起 投射 原则 . 论 旨 
准则 等 GB 理论 的 原则 系统 。 至 于 Jackendoff (1990) 、Grimshaw 
《1990) 等 , 则 有 意 提 高 论 元 结构 在 语法 理论 模型 中 的 地 位 ,尝试 把 论 
元 结构 当 作 是 介 于 词 库 和 深层 结构 之 间 的 一 个 独立 的 语言 知识 的 表 
达 层 次 ,并 着 力 探索 论 元 结构 的 内 部 结构 及 其 运作 机 制 。 更 有 甚 者 ， 
Levin 人 Rappaport 《1995) 假 设 , 在 词 库 和 句法 表达 (syntactic rep- 
resentation) 层 面 之 间 有 两 个 界面 : (i) 词汇 语义 表达 式 (lexical- 
semantic rfepresentation)，(ii) 词汇 句法 表达 式 (lexical-syntactic 
representation) ,也 称 为 论 元 结构 (argument structure) ; 词汇 从 词 库 
到 句法 层面 要 先 经 过 词汇 语义 表达 式 , 再 经 过 词汇 句法 表达 式 。 某 
些 词汇 经 过 这 两 个 层面 可 以 衍 变 为 新 的 词汇 ,如 非 宾 格 动词 Cunac- 
cusative verb) 中间 动 词 (middle verb) 等 。 这 是 理论 语言 学 界 对 词 
库 和 句法 结构 的 互动 关系 研究 的 一 个 重要 的 方面 ,下 面 检讨 一 下 汉 
语 语言 学 中 相应 的 研究 和 理论 分 歧 。 、 
汉语 语言 学 界 从 上 个 世纪 八 十 年 代 以 来 ,先后 对 动词 .形容词 和 
名 词 的 配 价 情况 作 了 比较 仔细 的 研究 ; 又 对 述 补 结构 、. 述 趋 结构 等 动 
词性 结构 的 配 价 情况 进行 了 初步 的 研究 。 并 且 , 自 觉 地 在 论 元 结构 
理论 的 框架 下 对 配 价 研究 进行 改造 。 后 来 , 沈 家 、 张 伯 江 等 先生 又 
在 Goldberg (1995) 的 句 式 语法 (Construction Grammar) 思想 的 影 
响 下 , 著 文 强调 句 式 也 有 指派 论 元 的 功能 、 句 式 配 价 比 动词 配 价 更 重 
要 ,希望 以 此 来 解释 跟 动 词 的 论 元 结构 不 相符 合 的 句 式 构造 。 例 如 ; 


〈1) 王 冕 七 岁 上 死 了 父亲 。 

〈2) 我 吃 了 小 明 一 个 苹果 。 
在 上 例 中 ,一 元 动词 “ 死 ? 带 了 两 个 论 元 ,二 元 动词 “ 吃 ” 带 了 三 个 论 
元 。 如 果 认 为 动词 的 论 元 结构 决定 了 以 它 为 谓语 核心 的 句子 的 构 
造 , 那 么 就 必须 假设 这 里 的 “ 死 、 吃 ?发 生 了 变价 。 这 个 口子 一 开 , 其 
结果 会 导致 词 无 定价 ,从 而 宣告 词汇 主义 (lexicalism) 的 破产 。 如 果 
认为 句 式 是 一 种 独立 的 语法 实体 ,可 以 容纳 有 关 动 词 进入 其 中 ; 那 
么 ,上 述 例子 就 比较 容易 解释 。 但 是 , 随 之 而 来 的 问题 是 : 怎样 说 明 
不 同 的 句 式 对 有 关 动 词 的 选择 限制 条 件 。 比 如 , 双 宾 语句 为 什么 既 
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能 容纳 “给 类 三 元 动词 ,又 能 容纳 “ 吃 ? 类 二 元 动词 ;到 底 具 有 什么 样 
的 句法 .语义 特征 的 动词 可 以 进入 双 宾语 句 ? 真理 也 许 就 在 两 极 之 
间 , 采 取 动 词 的 论 元 结构 跟 句 式 的 论 元 结构 互动 的 观念 ,也 许可 以 较 
好 地 解决 上 述 问题 .9 

下 面 ,我 们 通过 几 种 对 于 同一 个 具体 现象 的 不 同 的 处 理 方案 ,来 
看 词 库 结 构 与 句法 操作 的 互动 关系 。 众 所 周知 ,现代 汉语 中 的 工具 、 
处 所 方式 .目的 ` 共 事 等 论 元 角色 一 般 只 能 通过 介词 的 引导 而 作 状 
语 ;但 是 ,有 时 它们 中 的 一 部 分 却 可 以 有 条 件 地 直接 作 宾语 。 例 如 


(3) 用 毛笔 写字 一 写 毛笔 用 烟斗 抽烟 一 抽烟 和 斗 
在 食堂 里 吃饭 ~ 吃食 堂 ”在 地 板 上 睡觉 一 睡 地 板 
用 花 腔 唱歌 一 喝 花 腔 用 笋 碑 体 写字 一 写 笋 碑 体 
为 买 带鱼 排队 一 排 带 鱼 ”为 买 钢材 奔跑 一 跑 钢材 
跟 日 本 队 打 球 一 打上 日 本 队 跟 野 女人 睡觉 > 睡 时 女人 


这 种 现象 , 邢 福 义 (1991) 称 之 为 “宾语 代入 ”, 即 其 他 成 分 代入 常规 宾 
语 的 位 置 。 喜 航 林 (1998) 从 施 事 、 受 事 等 语义 成 分 跟 主语 、 宾 语 等 句 
法 成 分 配 位 的 角度 ,假设 存在 着 述 题 化 这 种 调整 配 位 的 语法 机 制 来 
作出 解释 。 大 意 是 : 施 事 等 主体 性 论 元 通常 实现 为 句子 的 主语 , 受 
事 等 客体 性 论 元 通常 实现 为 句子 的 宾语 ,工具 、 处 所 、 方 式 等 环境 性 
论 元 通常 实现 为 句子 的 状语 ,这 是 无 标记 的 配 位 方式 ;但 是 ,客体 性 
论 元 和 环境 性 论 元 可 以 通过 话题 化 (topicalization) 这 种 语法 过 程 而 
实现 为 主语 ,主体 性 论 元 和 环境 性 论 元 可 以 通过 述 题 化 (rhemiza- 
tion) 这 种 语法 过 程 而 实现 为 宾语 ,这 是 有 标记 的 配 位 方式 。 启 动 述 
题 化 这 种 语法 过 程 的 动因 是 说 话 人 想 让 主体 性 论 元 和 环境 性 论 元 成 
为 句子 的 语义 重心 ,所 以 强行 占据 宾语 这 个 句子 的 常规 焦点 的 位 置 。 
同时 还 假设 ,伴随 着 述 题 化 这 种 语法 过 程 ,成 为 宾语 的 主体 性 论 元 和 
环境 性 论 元 在 语义 上 经 历 了 受 事 化 的 过 程 , 即 包含 (十 受 动 ] 这 一 动 
态 的 语义 特征 (第 135 一 142 页 ) 。 这 种 处 理 方案 的 缺陷 是 显而易见 
的 。 因 为 , 述 题 化 的 语法 过 程 , 隐 含 了 主体 性 论 元 和 环境 性 论 元 向 宾 


@ ”关于 这 方面 的 讨论 , 详 见 圳 航 林 (2002a) 及 所 引文 献 。 
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语 位 置 移动 这 种 句法 操作 ;于 是 ,在 理论 上 就 必须 回答 两 个 问题 ， 
GD 向 后 移动 的 成 分 有 没有 留 下 语 迹 (trace) ,如 果 有 ,那么 后 移 成 分 
怎么 管辖 其 语 迹 ,从 而 使 句子 获得 正确 的 语义 解释 ? (ii) 常规 的 受 
事 宾 语 到 哪儿 去 了 ,有 没有 留 下 语 迹 ? 如 果 有 ,那么 由 什么 成 分 来 管 
辖 ? 从 GB 理论 的 眼光 来 看 ,向 后 移 位 这 种 句法 操作 是 根本 不 可 能 
的 , 它 直 接 违 背 了 投射 原则 和 论 旨 准 则 .O 

这 些 问 题 , 冯 胜利 (2000) 用 焦点 韵律 迫使 下 的 核心 词 移 位 这 种 
理论 假设 ,作出 了 很 好 的 处 理 。 其 大 意 是 :“ 写 毛笔 > 的 底层 结构 是 
“用 毛笔 写字 ”, 后 者 的 构造 是 :@ 

《4) veLV( 用 ) 十 ve[LNP( 毛 笔 ) 十 ww[V( 写 ) 十 NP( 字 )]]] 

当 动词 " 用 ”和 常规 宾语 “ 字 ” 不 出 现 的 情况 下 ,动词 “ 写 ” 通 过 从 核心 
到 核心 的 移 位 (head-to-head-movement ) 而 进入 “用 ”的 位 置 ( 第 
171 一 179)。 但 是 ,这 种 分 析 还 是 留 下 了 一 堆 问题 : (i)) 这 个 不 出 现 
的 常规 宾语 是 什么 性 质 的 空 语 类 ,要 不 要 受到 管辖 , 由 谁 来 管辖 ? 
ia) 引进 工具 论 元 的 动词 “用 ”是 怎样 “ 非 音 化 > 的 ? 汉 胜 利 (2000， 
176) 说 “ 表 使 动 的 动词 在 句法 上 可 以 * 非 音 化 "形式 出 现 ,因此 表 工 具 
的 动词 也 可 以 *“ 非 音 化 ?形式 出 现 ”, 这 种 推论 的 逻辑 基础 何在 ? 《iii) 
像 (4) 这 种 结构 分 析 是 特 设 的 (ad hoc) , 专 为 核心 移 位 而 假设 的 。 
Giv) 除了 工具 论 元 之 外 ,还 有 处 所 方式 目的、 共事 等 环境 论 元 , 岂 
一 个 "用 ? 字 所 能 了 得 ? 〈v) 根据 “ 辅 重 原理 ”, 像 状语 这 种 动词 之 前 
的 非 核心 位 置 , 也 是 比较 常规 的 焦点 重音 的 位 置 ;因此 ,这 里 所 谓 的 
核心 词 移 位 的 韵律 动机 并 不 一 定 存在 。 

鉴于 上 述 的 种 种 困难 ,我 们 怀疑 : 从 句法 操作 上 来 解释 “宾语 代 
和 "现象 的 路 子 , 可 能 在 根本 上 是 错误 的 ,至 少 是 极 不 经 济 的 。 如 果 
承认 在 词 库 和 句法 表达 之 间 有 论 元 结构 这 一 表达 层面 ,那么 我 们 可 
以 假设 部 分 动词 的 论 元 结构 在 这 一 前 句法 (pre-syntax) 层 面 上 可 以 
在 某 种 语义 、 语 用 因素 的 驱动 下 发 生变 化 , 即 产生 新 的 .有 标记 的 论 


@ 这 一 点 是 徐 杰 学 长 在 “汉语 话题 和 焦点 学 术 讨论 会 >(2000 年 6 月 香港 理工 大 学 ) 
期 间 提醒 我 注意 的 , 汉 胜 利 (2000: 174) 也 简略 地 提 及 。 
@ 冯 胜 利 (2000: 174) 用 的 是 树 形 图 ,我 们 为 了 节省 篇 幅 而 改 成 括号 式 。 
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元 结构 ;这 种 有 标记 的 论 元 结构 最 终 投射 成 有 标记 的 句法 结构 。 还 
是 拿 “ 写 毛笔 >” 作 例子 ,* 写 ”的 常规 的 论 元 结构 包括 : 施 事 和 受 事 两 
个 强制 性 的 论 元 角色 ,以 及 工具 方式 .处 所 等 可 选 性 的 论 元 角色 ; 记 
作 [ 写 : A，(LLM/L)，_ ，P]。 这 种 常规 的 论 元 结构 可 以 投射 成 无 
标记 的 句法 结构 ,如 :“ 小 明 用 毛笔 写字 ”等 。 但 是 ,在 现实 交际 中 ， 
人 们 有 时 想 突 出 工具 方式 ` 处 所 等 可 选 性 的 论 元 角色 ,强调 它们 在 
某 种 情形 下 不 只 是 环境 性 的 论 元 角色 ,而 是 受到 动词 所 表示 的 动作 
直接 影响 的 角色 ;于 是 ,强行 把 它们 转变 为 受 事 性 的 论 元 角色 ,而 原 
有 的 受 事 论 元 只 能 引退 淡出 为 隐 性 论 元 (implicit argument) ,不 能 
在 句法 结构 上 投射 出 来 。 比 如 ,为 了 突出 “ 写 ” 的 工具 论 元 “毛笔 ”的 
受 动 性 ,把 它 转 变 为 受 事 论 元 ,并 把 原 有 的 受 事 论 元 “ 字 ” 挤 出 动词 
“ 写 ” 所 激活 的 语义 场景 (scenes) 的 透视 域 (perspective) 之 外 ;形成 了 
“ 写 ” 的 有 标记 的 论 元 结构 [ 写 : A, S, P(D)]。 这 种 有 标记 的 论 元 结 
构 可 以 投射 成 有 标记 的 句法 结构 ,如 :“ 小 明 写 毛笔 "等 。 也 就 是 说 ， 
把 某 些 动词 的 环境 性 论 元 占据 宾语 位 置 ,归结 为 这 些 动词 在 论 元 结 
构 层 面 上 发 生 了 论 元 结构 转变 的 过 程 ; 突 出 地 表现 为 从 可 选 的 环境 
性 论 元 变 为 强制 性 的 域内 论 元 ,并 且 在 语义 上 获得 受 动 性 的 特征 。 
例如 : 


(5) a。? 小 明 一 天 到 晚 写 大 字 ,都 写 坟 了 好 几 支 毛 笔 了 。 
b.、 ?9? 小 明 一 天 到 晚 写 大 字 , 把 毛笔 都 写 秃 了 好 几 支 
人 
c。 小明 一 天 到 晚 写 毛笔 ,都 写 秃 了 好 几 支 毛笔 了 。 

d， 小 明 一 天 到 晚 写 毛笔 ,把 毛笔 都 写 元 了 好 几 支 了 。 

(6) a? 张 老 师 喜欢 写 板 书 , 一 堂 课 下 来 写 得 黑板 满 满 当 


当 的 。 

b。?? 张 老 师 喜 欢 写 板书 ,一 堂 课 下 来 把 黑板 写 得 满 
c。 张 老师 喜欢 写 黑板 ,一 堂 课 下 来 写 得 黑板 满 满 当当 
的 。 


b. 张 老师 喜欢 写 黑 板 , 一 堂 课 下 来 把 黑板 写 得 满 满 当 
当 的 。 
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《7) 我 抽 他 的 雪 菠 , 坐 他 的 沙发 , 睡 他 的 老 光 。(《 百 变 神 
偷 》) 


《5 一 6) 的 a 和 b 不 如 c 和 d 来 得 连贯 和 通顺 ,尽管 “ 写 大 字 ” 已 经 隐 
含 了 工具 “毛笔 >"“ 写 板书 ”已 经 隐 含 了 处 所 “黑板 ;但 是 ,后 续 小 句 
直接 把 这 个 前 一 小 句 中 隐 含 的 工具 .处 所 直接 处 理 成 受 事 的 表达 方 
式 还 是 使 人 觉得 突 匹 。 而 (5 一 6) 的 < 和 d 在 前 一 小 句 中 已 经 把 “ 写 ” 
的 工具 “毛笔 ?和 处 所 “黑板 ” 受 事 化 了 ,因此 为 它们 进入 后 续 的 受 事 
宾语 句 c 和 有 标记 的 处 置 受 事 的 句 式 d 作 了 足够 充分 的 铺垫 。(7) 
是 更 为 极端 的 例子 ,这 是 电影 ( 百 变 神偷 》 中 警察 局 长 在 法 官 家 里 说 
的 一 句 话 。 因 为 法 官 总 是 为 窃 富 济贫 的 神偷 辩护 ,使 神偷 免 耶 刑 事 
责任 ;警察 局 长 恨 透 了 这 个 法 官 , 跟 法 官 的 后 任 太太 偷情 ,并 坐 在 法 
官 家 的 沙发 上 一 边 抽 法 官 的 雪茄 ,一 边 说 了 上 面 这 名 泄愤 的 话 。 其 
中 ， 抽 他 的 雪茄 > 是 常规 的 “动作 一 受 事 ” 关 系 , 属 于 无 标记 的 表达 ; 
而 “ 坐 他 的 沙发 ?是 特殊 的 “动作 一 受 事 性 处 所 ”关系 ,“ 睡 他 的 老婆 ” 
是 特殊 的 “动作 一 受 事 性 共事 ”关系 ,它们 都 是 有 标记 的 表达 。 在 警 
察 局 长 的 心目 中 ,在 法 官 家 的 沙发 上 坐 、. 跟 法 官 的 太太 通奸 ,和 抽 法 
官 的 雪 荔 一 样 ,都 是 一 种 直接 的 处 置 性 行为 ,并 间接 地 使 法 官 受 到 影 
响 。 这 些 例 子 有 力 地 说 明 , 代 和 宾语 在 语义 上 的 确 具有 受 动 性 。 

总 之 ,这 一 切 证 明 介 于 词 库 和 句法 表达 之 间 应 该 有 论 元 结构 这 
一 语言 知识 的 表达 层面 。 在 这 一 层面 上 ,动词 性 成 分 的 论 元 结构 在 
某 些 语义 . 语 用 因素 的 促 动 下 可 以 发 生变 化 , 即 派生 出 新 的 有 标记 的 
论 元 结构 。 最 终 ,这 种 新 的 .有 标记 的 论 元 结构 会 直接 投射 到 句法 表 
达 层 面 上 来 , 即 实现 为 有 标记 的 句法 表达 形式 。 也 就 是 说 ,解决 词 库 
中 动词 的 句法 .语义 特性 与 表层 的 句法 表达 式 之 间 的 不 一 致 ,并非 二 
定 要 诉 诸 句法 操作 这 种 不 太 经 济 的 手段 。 


7 结语 : 多 层面 互动 的 限度 和 原则 
句法 ,形态 (词汇 ) 和 音 系 的 多 层面 互动 ,显然 不 是 漫 无 边际 的 ; 


而 是 有 一 定 的 限度 ,并 且 遵 循 一 定 的 原则 的 。 比 如 , Elizabeth SeL- 
kirk 等 人 发 展 的 韵律 结构 理论 (prosodic structure theory， 简称 
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PST) 发 现 : (i) 音 步 层级 以 上 的 散 律 成 分 的 边界 是 由 句法 域 (syn- 
tactic domain) 的 边界 投射 (选择 ) 的 。 典 型 的 情况 是 : 一 个 词汇 X 
的 边界 投射 为 一 个 韵律 (或 音 系 ) 词 的 边界 ,一 个 XP 的 边界 投射 为 
一 个 音 系 短语 的 边界 。 至 于 音节 和 音 步 的 边界 ,不 是 由 句法 投射 的 ， 
而 是 在 词 的 基础 上 组 织 起 来 的 。(ii) 音 系 学 只 能 有 限度 地 利用 (has 
limited access to) 句 法 学 ,因为 从 形态 一 句法 边界 到 韵律 边界 的 投射 
是 音 系 学 和 句法 学 之 间 唯 一 的 界面 (interface)。 一 旦 投射 完毕 , 音 
系 学 就 是 完全 独立 的 。(iii) 韵律 结构 是 受到 严格 阶层 假设 (strict 
layer hypothesis) 限 制 的 。 这 个 假设 规定 : 韵 律 成 分 只 能 划分 成 音 
节 、 音 步 、. 韵 律 词 . 音 系 短 语 等 数目 有 限 的 范畴 ,这 些 范畴 是 按照 层级 
关系 组 织 起 来 的 ;于 是 , 像 音 系 短语 就 只 能 支配 (dominate) 韵 律 词 ， 
韵律 词 依次 只 能 支配 音 步 .2 Duanmu (1995) 通 过 对 上 海 话 和 人 台湾 
赣 南 话 的 变调 域 的 研究 ,指出 他 在 以 下 几 个 方面 同意 PST: (i) 形 
态 -句法 边界 投射 为 音 系 边界 。(ii) 音 系 学 只 能 从 句法 学 那儿 接受 
(assume) 有 限 的 信息 。 像 名 词 动词 .形容 词 等 句法 范畴 和 成 分 统 
制 关 系 等 信息 是 不 能 利用 的 。 需 要 的 只 是 X-bar 结构 这 一 层面 ,于 
是 一 个 X 投射 接受 复合 词 (compound) 重 音 , 一 个 XP 投射 接受 短 
语 重 音 。(iii) 一 旦 适当 的 边界 业已 投射 成 功 ,那么 就 不 必 求 助 于 名 
法 信息 了 。(iv) 音 系 域 和 形态 一 句法 域 的 错误 匹配 ,可 以 由 随后 的 
独立 的 节律 处 理 过 程 ( 比 如 ,重音 冲突 的 消解 ) 来 解释 …”…('P. 2512 。 

但 是 ,句法 学 对 音 系 信息 的 依赖 和 利用 的 限度 就 不 那么 清楚 了 。 
像 汉 胜利 (2000) 企 图 用 韵律 要 求 来 解释 汉语 “把 ?字句 “被 "字句 、 主 
题 句 等 句子 中 宾语 位 置 的 移动 ,动词 之 后 的 介 宾 结 构 中 的 介词 贴 附 
在 动词 上 ,历史 上 介 宾 结构 位 置 从 动词 后 向 动词 前 的 转移 `SOYV 结 
构 向 SVO 结构 的 转移 、 以 及 “被 ”字句 和 “把 ”字句 的 产生 和 发 展 等 
历史 句法 问题 ,就 颇 让 人 怀疑 : 韵律 对 句法 的 作用 会 有 这 人 么 大 吗 ? 
不 管 答案 是 肯定 还 是 否定 , 音 系 因素 对 句法 的 影响 的 限度 和 原则 是 
目前 多 层面 互动 研究 中 最 紧迫 的 课题 ,我们 期 待 着 能 跟 上 述 的 PST 
相应 的 韵律 句法 理论 的 诞生 。 


@ 详 见 Duanmu (1995: 250) 。 
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互 、 附 


赵 元 任 先生 评传 


1 语言 奇才 ”学 人 生涯 


赵 元 任 (1892 一 1982) ,著名 语言 学 家 ,中 国 现代 语言 学 的 开创 者 
之 一 。1892 年 11 月 3 日 生 于 天 津 紫竹 林 ,4 岁 开 蒙 ,1902 年 (10 岁 ) 
开始 在 家 里 读 私房 ,1906 年 (14 岁 ) 在 老家 常州 接受 新 式 学 校 教育 ， 
1907 年 (15 岁 ) 转 和 人 南京 江南 高 等 学 堂 预科 。1910 年 (18 岁 )7 月 21 
日 参加 清华 学 校 庚 子 赔款 留学 美国 学 生 考 试 ,以 73. 2/3 分 的 成 绩 被 
录取 为 第 二 次 考取 清华 学 校 康子 赔款 留学 美国 学 生 榜 第 二 名 。8 月 
下 旬 赴 美人 康 奈 尔 大 学 , 主 修 数 学 。1914 年 (22 岁 ) 毕 业 后 继续 在 该 
校 修 习 哲 学 。1915 年 (23 岁 ) 转 和 人 哈佛 大 学 ,1918 年 (26 岁 ) 获 哲学 
博士 学 位 。1919 年 (27 岁 ) 任 康 奈 尔 大 学 物理 学 讲师 。1920 年 (28 
岁 ) 回 国 到 清华 学 校 任教 。1921 一 1924 年 赴 美 任 哈佛 大 学 哲学 系 讲 
师 、, 教 授 。1925 年 (33 岁 ) 回 国 ,1925 一 1929 年 任 清华 学 校 ( 国 学 ) 研 
究 院 导师 。1929 一 1938 年 任 中 央 研 究 院 历史 语言 研究 所 研究 员 兼 
语言 组 主任 。1938 年 (48 岁 ) 赴 美 , 先 后 在 夏威夷 大 学 .耶鲁 大 学 . 哈 
佛 大 学 `. 加 利 福 尼 亚 大 学 伯 克 莱 分 校 任 教 。1945 年 当选 为 美国 语言 
学 会 会 长 。1981 年 被 北京 大 学 授予 名 誉 教授 称号 。1982 年 病逝 于 
美国 麻 省 剑桥 ,终年 九 十 岁 。 

赵 元 任 从 小 对 学 习 语 言 和 方言 有 特别 的 兴趣 ,并 表现 出 极 高 的 
天 赋 。 小 时 候 由 于 一 家 三 代 跟 着 祖父 赵 执 褒 在 河北 各 地 居住 ,因而 
起 先 说 的 不 是 家 乡 话 常州 话 ,而 是 一 种 南方 口音 很 重 的 北京 话 ; 比 
如 ,舌尖 后 音声 母 ( 即 卷 舌 音 zh-，ch-，shi-，t-) 混 同 于 舌尖 前 和 表 
尖 中 辅音 声母 ( 即 ，c-，s-，L-) ,分 不 清 前 鼻音 韵尾 -n 和 后 鼻音 韵 
尾 -ng。 后 来 ,又 从 带 他 的 周 妈 那 儿 学 了 保定 话 。 赵 元 任 学 的 第 一 种 
别处 的 话 不 是 他 本 乡 的 常州 话 ,而 是 江苏 常熟 话 ; 因为 远 嫁 江 苏 常熟 
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的 姑妈 带 着 两 个 表 弟 来 北方 省 亲 ,为 了 跟 他 们 玩 要 ,在 5 岁 那 年 他 就 
学 会 了 说 一 种 地 道 的 常熟 话 , 尽 管 当 时 他 念书 用 的 是 常州 音 。1901 
年 (9 岁 ) 祖 父 去 世 , 他 随 家 人 回 常 州 居住 和 上 学 , 才 开 始 学 常州 话 。 
1904 年 (12 岁 ) 那 年 父母 亲 同 年 病逝 ,第 二 年 他 到 苏州 大 姨娘 庞 汉 氏 
家 居住 ;于 是 ,他 自然 地 学 会 了 第 四 种 方言 苏州 话 。 后 来 ,他 又 从 在 
福州 住 过 多 年 的 伯母 那儿 学 了 一 点 儿 福 州 话 。1907 年 (15 岁 ) 去 南 
京 读书 ,他 尽管 不 喜欢 南京 的 口音 ,但 是 出 于 对 方言 的 特别 兴趣 ,不 
入 就 学 会 了 南京 话 。 在 南京 的 三 年 中 , 跟 室 友 福 州 人 邵 绳 起 交换 方 
言 ,互相 教 常 州 话 和 福州 话 ; 有 最终, 他 又 学 到 了 更 多 的 福州 话 。 到 南 
京 的 第 三 年 (1908 年 ), 他 开始 跟 美 国 先生 嘉 化 (David John Carver) 
在 课 演 上 学 英语 。1910 年 (18 岁 ) ,在 南京 三 年 预科 没 读 完 , 进 京 投 
考官 费 留 美 生 ;在 北京 预备 了 一 个 春天 ,期 间 还 学 了 一 阵子 拉丁 文 ; 
这 也 是 当选 科 之 一 。 进 了 康泰 尔 大 学 以 后 ,他 又 学 了 德语 ;他 还 从 二 
个 国际 函授 学 校 学 了 法 语 。 在 此 期 间 , 因 为 跟 无 锡 人 大 胡 明 复 同 住 ,就 
学 会 了 无 锡 话 。 进 哈佛 大 学 研究 院 以 后 ,他 还 选 学 了 焚 文 : 回国 以 
后 ,他 又 学 会 了 上 上海 话 、 潮 北 话 等 汉语 方言 。1920 年 英国 哲学 家 罗 
素 (Bertrand Russell) 访 华 作 学 术 演 讲 , 赵 元 任 担 年 翻 译 。 有 一 次 ， 
他 陪 罗 素 坐 长 江 轮 船 到 长 沙 演讲 ,向 同 船 的 邀请 罗素 的 主人 (长 沙 
人 ) 学 了 湖南 话 。 到 了 长 沙 以 后 ,他 居然 用 那 种 国语 底子 的 湖南 话 作 
翻译 。 赵 元 任 的 语言 天 才 和 丰富 的 语言 和 方言 经 验 , 为 他 从 事 语言 
研究 提供 了 得 天 独 厚 的 条 件 。 

赵 元 任 从 事 语言 学 理论 和 汉语 语言 学 研究 长 达 60 余年 ,在 推行 
国语 、 设 计 汉 语 拼音 方案 .汉语 方言 调查 和 研究 、 音 位 学 理论 研究 和 
记 音 方法 与 记 音 工具 的 设计 、 汉 语 语法 研究 .普通 语言 学 理论 研究 等 
方面 都 有 重要 的 贡献 。 他 共 出 版 著作 10 余 种 ,论文 60 余 篇 。 赵 元 
任 六 ,七 十 年 代 的 论文 或 讲演 稿 由 Anwar S、Dil 编 成 Aspecis oF 
Ciz7zzese Socioli728uisticy， 忆 Ssay5 0y Yauez Ren Chao( 汉 语 社 会 语言 
学 面面观 - 赵 元 任 论文 选 ,Stanford University Press，1976 ) 。 叶 碍 
声 选 译 了 其 中 的 3 篇 ,加 上 30 年 代 的 一 篇 , 编 成 4 赵 元 任 语 言 学 论文 
选 兴 伍 铁 平 校 , 中 国 社会 科学 出 版 社 ,1985 年 )。 为 了 纪念 赵 元 任 诞 
辰 100 周年 , 袁 秘 林 选 了 赵 元 任 的 12 篇 论文 , 编 成 (中 国 现代 语言 
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的 开拓 和 发 展 - 赵 元 任 语言 学 论文 选 % 清 华 大 学 出 版 社 ,1992 年 。 
2 推广 国语 ”设计 拼音 


20 年 代 初 , 赵 元 任 先生 回国 以 后 不 久 , 就 满怀 热情 地 投身 于 当 
时 的 国语 统一 运动 。 他 1920 年 8 月 回国 ,9 月 18 日 就 参加 了 在 北 
京 举 行 的 国语 统一 运动 筹备 委员 会 会 议 。 他 不 仅 编写 国语 课本 、 灌 
制 配 套 唱 片 ; 还 根据 语音 学 原理 设计 了 拉丁 字母 式 的 汉语 拼音 方案 ， 
为 汉语 书写 系统 的 拼音 化 和 拉丁 化 奠定 了 坚实 的 基础 。 

赵 元 任 1922 年 由 商务 印 书馆 出 版 4 国语 留 声 片 课本 》, 还 发 行 了 
由 他 发 音 的 配套 唱片 。 所 依据 的 标准 音 是 4 国 音字 典 》1920) 中 兼顾 
古今 南北 的 老 国 音 。 这 种 老 国 音 与 京 音 ( 北 京 音 ) 稍 有 差别 ,比如 : 京 
音 没有 人 声 , 国 音 有 和 人 声 ; 京 音 不 分 尖 团 , 国 音 分 尖 团 。 后 来 , 据 赵 元 
任 自己 说 ,只 剩 下 他 一 个 人 会 说 这 种 有 人 和 人 声 的 老 国 音 。 事 实证 明 , 这 
种 兼顾 古今 南北 的 国 音 是 无 法 推广 的 。 在 哈佛 大 学 哲学 系 任教 期 
间 , 赵 元 任 1922 年 在 《国语 周刊 )1 卷 7 期 上 发 表 《 国 语 罗马 字 的 研 
究 》。1923 年 , 又 在 《中 国 留 学 生 月 刊 》(CThe CPzimrese Sizdezt5 
Montply)18 卷 8 期 上 发 表 文 章 ^Principles of Romanization”, 提出 
了 建立 实用 的 国语 罗马 字 系 统 应 该 考虑 的 25 条 原则 。 这 为 汉语 书 
写 系统 的 拼音 化 和 拉丁 化 作出 了 充分 的 理论 准备 。 

赵 元 任 1925 年 回 清华 (国学 ) 研 究 院 任 教 不 久 , 于 1925 年 9 月 
参加 由 刘 复 ( 半 农 ) 发 起 的 “ 数 人 会 ”; 与 刘 复 、` 钱 玄 同 、 黎 锦 申 、 汪 怡 、 
林语堂 、 周 辨 明 诸 君 子 讨论 国语 运动 问题 。 他 们 经 过 一 年 时 间 ,开会 
22 次 , 九 易 其 稿 , 终 于 拟定 《国语 罗马 字 拼 音 法 式 》 稿 本 。1926 年 9 
月 ,国语 统一 筹备 会 ”召开 “国语 罗马 字 拼 音 研究 委员 会 ”, 通 过 并 提 
请 教育 部 公布 。1928 年 9 月 26 日 ,国民 政府 大 学 院 公 布 这 套 由 赵 
元 任 设 计 的 国语 罗马 字 方 案 , 作 为 “ 国 音 字母 第 二 式 ”。 他 还 用 它 来 
翻译 《最 后 五 分 钟 》。1935 年 赵 元 任 由 商务 印 书馆 出 版 (新 国语 留 声 
片 课本 》 甲 种 (注音 符号 本 ) 和 乙 种 (国语 罗马 字 本 ) ,还 发 行 了 由 他 发 
音 的 唱片 16 面 。 所 依据 的 标准 音 是 《 国 音 常用 字汇 》(1932) 中 紧 靠 
北京 话 的 新 国 音 ,把 老 国 音 中 北京 话 所 没有 的 音 都 取消 了 ;因此 ,这 
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跟 中 华人 民 共 和 国 建立 后 以 北京 话 为 标准 音 的 普通 话 是 一 致 的 。 到 
了 晚年 ,他 老 戏 伏 杞 ,孜孜不倦 地 研究 “ 通 字 ”。 所 谓 “ 通 字 ” 就 是 在 国 
语 罗 马 字 的 基础 上 ,增加 吴语 .粤语 、 闽 语 的 区 别 。1973 年 ,他 把 ( 通 
字 草 案 ; 带 回国 ,听取 意见 ,继续 修改 。1983 年 ,商务 印 书馆 编辑 部 
把 它 译 成 中 文 ,以 中 英 对 照 的 方式 出 版 。 

赵 元 任 发 扬中 国 传统 语言 学 注重 实践 的 优良 传统 ,学 以 致 用 . 身 
体力 行 , 积 极 参加 国语 统一 运动 .亲手 设计 国语 罗马 字 , 从 理论 到 实 
践 , 在 推行 国语 工作 和 设计 汉语 拼音 方案 方面 起 了 示范 作用 。 


3 调查 方言 ”建立 新 学 


本 世纪 20 年 代 是 世界 语言 学 发 生 深刻 变化 的 时 期 ,当时 有 两 股 
研究 思潮 推动 着 现代 语言 学 的 诞生 。 一 股 是 传统 语言 学 阵营 中 的 结 
构 主 义 语 言 学 思潮 ,瑞士 语言 学 家 索 绪 尔 (F. de Saussure, 1857 一 
1913) 在 长 期 的 印 欧 系 古代 语言 和 比较 语言 学 的 研究 实践 中 逐步 形 
成 了 对 语言 的 符号 性 质 和 系统 价值 的 独到 认识 ,首创 了 普通 语言 
这 一 学 科 。 其 《普通 语言 学 教程 》(1916) 由 其 学 生 整 理 出 版 后 ,在 语 
言 学 界 产 生 了 广泛 的 影响 ,使 19 世纪 以 历时 为 主 的 语言 研究 转变 为 
20 世纪 以 共 时 为 主 的 结构 语言 学 。 另 一 股 是 美国 人 类 学 阵营 中 的 
描写 语言 学 思潮 ,以 鲍 阿 斯 (F. Boas) 为 代表 的 人 类 学 家 在 调查 、 记 
录 美 国 的 土著 语言 (印第安 人 的 各 种 语言 ) 的 实践 中 ,逐步 形成 了 一 
套 处 理 陌 生 语 言 的 分 析 方法 。 其 后 萨 否 尔 (E. Sapir) 出 版 了 《语言 》 
《1921) , 布 龙 菲尔德 (L. Bloomfield) 出 版 了 《语言 论 》(1933) ,发展 
出 一 套 严 格 的 语言 单位 的 发 现 程序 (discovery procedure) 。 

赵 元 任 两 度 留美 ,自然 受 美国 描写 语言 学 的 影响 较 大 ,加 上 中 国 
学 术 注 重 实践 的 传统 ,所 以 他 1925 年 应 聘 到 清华 (国学 ) 研 究 院 任 导 
师 后 ,立即 开始 了 他 一 生 中 最 重要 的 学 术 活 动 一 一 汉语 方言 调查 。 
他 带 着 杨 时 逢 赴 江苏 浙江 实地 进行 吴 方 言 的 调查 , 先 写 出 论文 ( 北 
京 \ 苏 州 、 常 州 语 助词 的 研究 》( 刊 《清华 学 报 》1926 年 第 3 卷 第 2 
期 )。 而 后 写 出 专著 《现代 吴语 的 研究 》 清 华 学校 研 究 院 1928 年 印 
行 ), 这 是 中 国 第 一 部 用 现代 语言 学 方法 研究 方言 的 著作 , 赵 元 任 也 


赵 元 任 先生 评传 435 


因此 获得 了 中 国 现代 语言 学 的 疯 基 人 的 称誉 。 

《现代 吴语 的 研究 》 共 6 章 , 分 “ 吴 音 ” 和 “吴语 ”两 部 分 。 前 4 章 
是 “ 吴 音 ”, 讨 论 各 处 吴语 的 声母 .韵母 和 声 凋 的 音 类 和 音 值 ,列举 各 
地 的 语音 特点 ,总结 吴语 的 共同 特征 ,指出 “吴语 为 江苏 浙江 当中 “并 
定 群 :等 母 带 音 ,或 不 带 音 而 有 带 音 气流 的 语言 "第 88 页 )。 后 2 章 
是 “吴语 ”讨论 词汇 .语法 等 问题 ,主要 内 容 是 30 个 方言 点 75 个 词 
的 词汇 对 照 表 和 22 个 方言 点 56 种 用 法 的 语 助词 对 照 表 。 词 汇 对 照 
表 之 后 列举 各 地 特别 的 词 , 如 上 海 话 “ 白 相 ”( 玩 儿 ) 温州 话 “ 吃 天 光 ” 
( 吃 早饭 ) 等 。 语 助词 对 照 表 之 后 有 成 篇 的 记 音 材料 。 此 外 ,书后 还 
附 有 作者 调查 时 所 用 的 各 种 表格 。 赵 元 任 在 方言 调查 时 最 先 使 用 国 
际 音标 记录 汉语 方言 ,9 语音 分 析 深 入 细致 ,并 能 联系 古代 音韵 考察 
汉语 的 古今 变化 ,使 错综复杂 的 语言 现象 得 到 科学 合理 的 解释 。 各 
地 声韵 调和 词语 异同 都 用 表格 形式 表示 ,便于 对 照 比 较 。 由 于 该 书 
调查 点 偏重 江苏 ,浙江 中 部 和 南部 的 调查 点 较 少 ,因而 吴 方 言 的 复杂 
情况 还 没有 得 到 充分 的 反映 .@ 尽管 如 此 , 赵 元 任 对 吴语 界限 的 规 
定 今天 看 来 还 是 很 合理 的 ;他 在 书 中 (第 1 页) 说 “广义 的 吴语 包括 
江南 的 东南 部 跟 浙江 东北 大 半 部 。 这 吴语 观念 的 定义 或 这 观念 的 能 
否 成 立 是 要 等 详细 研究 过 后 才 知 道 , 现 在 暂 定 的 “工作 的 假设 ?就 是 
暂 以 帮 济 并 , 端 透 定 , 见 溪 群 三 级 分 法 为 吴语 的 特征 ”因为 吴 方 言 塞 
音声 母 有 浊 塞 音 Lb，d，g]、 不 送气 清 塞 音 Lp, t，k] 和 送气 清 塞音 
(p”， tb，Kk27) 三 套 , 而 官话 和 大 部 分 南方 方言 具有 后 两 套 3 所 以 浊音 
的 有 无 可 以 作为 划分 吴 方 言 和 其 他 方言 界线 的 一 条 关键 的 同 语 线 
(Isoglos) 。 现 代 的 各 种 方言 地 图 就 是 根据 这 一 同 语 线 来 划分 吴 方 言 
和 其 他 方言 的 分 界 的 。 


@ 高 本 汉 早 年 调查 汉语 方言 用 的 是 其 师 本 A. Lundell 所 创造 的 瑞典 方言 字母 , 兄 高 
本 汉 (1940) 第 142 页 。 
四 ”参考 (中国 大 百科 全 书 。 语言 文 字 》, 第 421 页 。 
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4 借助 国学 ”创制 字 表 


赵 元 任用 描写 语言 学 的 方法 调查 汉语 方言 ,同时 又 充分 利用 中 
国 古 代 的 音韵 学 知识 来 控制 方言 调查 。 具 体 的 做 法 是 选择 比较 常用 
的 3,567 个 单字 ,按照 4 切 韵 兴 广 韵 》 一 系 韵 书 所 代表 的 中 古音 系统 
排列 成 表 ,形成 一 整套 的 “ 方 音调 查 表 格 ”。 表 格 中 的 字 先 按 13 摄 排 
列 ( 假 摄 归并 入 果 摄 、 江 摄 归 并 人 容 摄 、. 曾 摄 归 并 和 人 梗 摄 ), 同 摄 的 先 
分 开口 合 口 ,再 分 一 二 三 四 等 。 相 承 的 四 声 并 列 ,每 页 横行 的 韵 目 举 
平 以 肪 上 去 , 竖 行 按 36 字母 排列 。 这 样 ,声母 .韵母 .声调 搭 成 框架 ， 
每 个 字 放 在 各 自 应 占有 的 音韵 地 位 ,形成 一 张 张 韵 图 ,相当 于 现代 汉 
语 声韵 调配 合 表 。 用 这 种 字 表 调查 方言 的 音 系 , 不 但 便于 归纳 整理 
出 所 调查 的 方言 的 音 系 , 而 且 使 许多 复杂 不 易 解 释 的 现象 大 都 可 以 
得 到 理解 ,从 而 得 出 方言 音 系 在 古今 语音 演变 方面 的 条 理 。 

后 来 ,中 央 研 究 院 历史 语言 研究 所 正式 刊印 了 赵 元 任 制 的 《 方 音 
调查 表格 》(1930) 。 中 华人 民 共 和 国 成 立 后 ,中 国 科 学 院 语言 研究 所 
在 这 本 《表格 》 的 基础 上 , 删 去 原 表 格 中 不 必要 的 罗马 字 注 音 ,9 还 删 
去 了 一 些 不 常用 的 字 和 又 音字 ,改正 了 一 些 字 的 音韵 地 位 ,加 入 了 一 
些 常用 字 ,删改 和 增补 了 一 些 字 的 注释 ,改编 成 《方言 调查 字 表 》 
(1957) 。 几 十 年 的 实践 证 明 , 用 这 种 字 表 作为 调查 汉语 方言 语音 
基础 是 一 个 比较 简便 易 行 的 办 法 ,同时 它 还 可 以 作为 学 习 和 研究 汉 
语音 韵 的 参考 资料 .@ 这 也 是 中 国 的 描写 语言 学 一 开始 就 不 同 于 美 
国 描写 语言 学 的 一 个 重要 的 方面 。 原 来 ,中 国 的 描写 语言 学 一 直 是 
拿 历 史 语言 学 作 背 景 的 ;甚至 可 以 这 么 说 ,中 国 的 方言 研究 是 共 时 描 
写 和 历时 研究 结合 得 最 好 的 领域 。 


@ 这 使 人 想起 当时 的 一 名 笑话， 胡适 之 无 往 而 不 注 , 赵 元 任 无 往 而 不 音 ”。 
@ ”参考 4 中国 大 百科 全 书 。 语言 文字 》, 第 79 页 。 
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5 利用 新 学 ”更 新 旧 学 


在 赵 元 任 的 影响 下 ,20 一 40 年 代 中 国 的 方言 调查 呈现 出 活跃 的 
气象 ,出 版 了 一 批 具 有 较 高 学 术 价值 的 方言 研究 著作 。 比 如 , 赵 元 任 
的 《钟祥 方言 记 》1939) 和 《中 山 方言 (1948)、 罗 常 培 的 4 厦门 音 系 》 
《1930,) 和 《 临 川 音 系 》(1940)、 赵 元 任 等 的 《湖北 方言 调查 报告 》 
《1948) 。 这 种 方言 调查 研究 的 重要 性 ,只 有 联系 本 世纪 初 ( 五 四 前 
后 ) 汉 语音 韵 学 研究 出 现 了 严重 危机 的 历史 背景 才能 充分 体现 出 来 。 
大 家 知道 ,汉语 具有 悠久 的 历史 ,从 先秦 到 现代 汉语 的 语音 发 生 了 重 
大 的 变化 。 但 是 ,对 这 种 古今 语音 演变 的 研究 一 直 是 很 不 充分 的 。 
其 中 一 个 重要 的 原因 是 ,汉语 是 用 表意 的 方块 汉字 来 记录 的 ,方块 汉 
字 不 跟 统 一 的 语音 相 联 系 , 表 现 出 超时 代 、 跨 地 域 的 特点 ;同一 个 汉 
字 , 不 同时 代 \ 不 同 地 区 的 人 虽然 写法 相同 、 理 解 相 同 ,但 读音 可 以 完 
全 不 同 。 因 此 ,后 人 无 法 从 文字 上 了 解 古 代 的 语音 面 狐 和 历史 流 变 。 
于 是 ,传统 的 音韵 学 研究 只 能 根据 各 个 时 期 的 诗 前 以 及 背书 、 韵 图 等 
书面 文献 ,来 归纳 各 个 时 期 的 音 类 , 却 无 法 知道 每 一 个 音 类 的 具体 音 
值 。 比 如 ,由 顾炎武 开始 的 清 代 古音 学 利用 《诗经 》 的 用 韵 和 汉字 的 
谐 声 分 析 先 秦 的 古音 ,归纳 出 《诗经 》 的 韵 部 ,整理 出 谐 声 的 系列 , 弄 
清 了 从 上 古 到 中 古 的 韵 类 分 合 的 演变 情况 ,但 无 法 对 它 进 行 具体 的 
语音 学 描写 。 关 于 《 切 韵 》 系 统 的 韵书 的 研究 ,音韵 学 家 们 以 反切 为 
主 ` 以 前 图 为 辅 , 把 中 古 时 期 的 音 类 大 致 分 别 清楚 ,但 又 无 法 推测 它 
们 的 读 法 .就 这 样 , 轿 于 纸 上 的 材料 ,造成 了 音韵 学 研究 的 危机 。 
所 幸 的 是 ,现代 汉语 的 各 种 方言 都 是 从 古代 汉语 演变 来 的 ,根据 一 般 
语言 研究 的 结果 ,语音 的 演变 大 致 都 有 途径 可 寻 , 方 言 的 差异 就 是 演 
变 途 径 不 同 的 结果 .2 所 以 ,综合 考察 南北 方言 的 差异 ,可 以 罕见 古 
音 读 法 的 大 概 面 角 。 在 这 方面 ,瑞典 汉学 家 高 本 汉 (Bernhard Karl- 
gren,1889 一 1978) 捷 足 先 登 ,他 凭 圭 良好 的 历史 比较 语言 学 修养 和 


@ 详 见 徐 通 销 (1991) ,第 4.44.124 一 125 页 。 
四 ”参考 董 同 饰 (1974) ,第 139 页 。 
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精湛 的 瑞典 方言 调查 经 验 , 利 用 汉语 的 33 处 方言 (包括 日 译 吴 音 、 汉 
音 ,高 丽 译音 ,安南 译音 等 境外 方言 ) ,结合 4( 切 前 ) 等 “历史 上 的 旧 材 
料 ”, 给 以 4 切 韵 》 为 代表 的 中 古音 类 一 一 拟 测 (reconstruct) 了 具体 的 
音 值 ,为 中 古音 的 研究 黄 定 了 新 的 基础 ;使 汉语 音韵 学 除了 分 类 之 
外 ,在 拟 音 上 有 了 一 套 合适 的 方法 和 方便 的 工具 。 

由 于 引进 方言 材料 作为 考 订 古 音 的 佐证 ,使 濒于 危机 的 汉语 音 
韵 学 获得 了 新 生 , 也 使 人 们 重新 认识 到 方言 资料 在 汉语 史 研 究 中 的 
价值 。 赵 元 任 于 1921 年 得 到 高 本 汉 《 中 国 音韵 学 研究 》 的 前 三 册 ,9 
对 方言 调查 和 研究 的 重要 性 是 看 得 很 清楚 的 。 这 就 难怪 他 一 回 清华 
后 ,马上 要 一 头 扎 进 方言 调查 中 去 了 。 他 和 罗 常 培 ` 李 方 桂 历 时 四 五 
年 把 高 氏 巨 著 移 译 过 来 ,这 对 汉语 音韵 学 研究 的 推动 作用 也 是 不 可 
低估 的 。 


6 洞 烛 幽 徽 ” 发明 胜 义 


赵 元 任 在 对 吴语 的 调查 研究 中 ,形成 了 对 吴语 的 性 质 和 源头 的 
独到 认识 。 从 表面 上 看 尿 现代 吴语 的 研究 》 是 一 部 现代 吴 方 言 的 描 
写 比较 语音 学 著作 ,但 实际 上 已 隐 含 着 方言 差异 的 比较 和 重建 原始 
吴 方 言 之 间 的 内 在 联系 。 书 中 说 “所 用 材料 范围 甚 小 ,对 吴语 的 事 
实 虽 多 所 发 现 ,而 对 于 空间 与 时 间 上 的 远 处 的 推测 没有 什么 发 明 ” 
(第 3 页 ) 。 这 些 话 暗示 可 以 通过 方言 差异 的 比较 去 作 “ 空 间 与 时 间 
于 的 远 处 的 推测 ”。 有 些 语言 学 家 从 中 得 到 启发 ,设法 通过 方言 内 部 
的 差异 的 比较 去 重建 原始 方言 。 比 如 , 罗 杰 瑞 (美国 华盛顿 大 学 东亚 
系 教授 ) 受 赵 元 任 这些 话 的 启发 ,提出 了 "原始 闽 语 ?这 个 设想 ,并 对 
原始 闽 语 作 了 全 面 的 拟 测 .有 

指出 原始 方言 这 个 事实 是 很 重要 的 , 它 将 使 汉语 语音 史 研 究 的 
理论 框架 发 生变 革 。 高 本 汉 虽 然 认识 到 “在 近 古 汉语 的 时 候 已 有 不 


@ 详 见 高 本 汉 (1940) ,原著 于 1915、1916、1919、1926 分 四 册 出 版 。 
四“” 见 高 本 汉 (1940) ,第 7 页, 译 者 序 。 
回 “ 详 见 徐 通 销 (1991) ,第 144 一 145 页 。 
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同 的 方言 "第 238 页 ), 但 他 还 是 坚信 “在 主要 特征 上 我 们 这 部 书 所 
研究 的 每 一 种 方言 都 成 一 种 从 《 切 竟 ?所 代表 的 古代 汉语 直接 演变 下 
来 的 缩影 ”因为 “开口 合 口 , 显 介 音 成 素 ` 各 摄 的 主要 元 音 , 所 有 《 切 
前 ) 语 言 的 特征 ,在 我 们 的 方言 里 大 体 上 都 有 完全 合乎 规律 的 对 映 ” 
《第 528 页 )。 因 此 ,高 本 汉 认 为 《 切 韵 》 代 表 7 世纪 长 安 音 系 , 它 是 现 
代 汉 语 各 方言 的 原始 母语 ,可 以 “把 一 切 方 言 都 跟 { 切 前 》 的 语言 连接 
起 来 “第 528 页 ), 用 《 切 韵 》 来 解释 现代 方言 的 歧 异 。 现 在 ,由 赵 元 
任 隐 含 、. 由 罗 杰 瑞 发 明 的 原始 方言 的 观念 ,对 汉语 语音 史 的 研究 将 产 
生 茶 种 反 拨 的 作用 。 比 如 , 张 琨 (美国 加 州 大 学 伯克利 分 校 东 亚 系 教 
授 ) 充 分 认识 到 《 切 前 》 代 表 一 种 综合 音 系 , 反 映 * 南 北 是 非 ,古今 通 
塞 ” 的 特点 。 指 出 既然 4 切 前 》 包 含 各 地 方言 的 特点 ,那么 在 研究 它 与 
现代 汉语 各 方言 的 关系 时 ,就 不 应 该 笼统 地 把 它 看 成 母语 ,而 需要 根 
据 不 同方 言 的 特点 ,把 4 切 前 ;的 音 类 加 以 简化 ,剔除 一 些 不 属于 该 方 
言 的 因素 ,建立 原始 方言 的 音 系 , 进 而 比较 各 个 原始 方言 之 间 的 差异 
去 建立 原始 汉语 .9 这 真 可 谓 一 句 话 引 出 了 一 连 串 研究 和 真知 灼 
见 。 

赵 元 任 在 调查 方言 时 ,往往 能 注意 到 一 些 特殊 的 现象 ,并 敏锐 地 
发 现 其 中 所 隐 含 的 理论 价值 ,尝试 用 以 解决 一 些 重大 的 音韵 学 问题 。 
比如 ,他 调查 、 分 析 了 民间 8 种 利用 反切 方式 构成 的 秘密 语 , 发 现在 
反切 语 中 有 介 音 属 声 属 韵 的 问题 ;有 些 反切 语 的 i 介 音 两 属 , 即 反切 
上 下 字 都 要 求 有 i 介 音 ; 有 些 反 切 语 的 i 介 音 属 声 , 有 些 则 属 韵 .@ 
从 而 提出 了 “ 介 音 和 谐 ? 说 ,用 以 解决 关于 j 化 声母 的 争论 。 原 来 ,高 
本 汉 根 据 反 切 上 字 分 组 的 趋势 (一 二 四 等 是 一 组 ,三 等 是 一 组 ), 提 出 
了 三 等 字 声 母 j 化 的 观点 .@ 事实 上 ,这 种 分 组 是 不 严格 的 ,各 有 拿 
对 方 的 字 作 反 切 上 字 ; 并 且 , 精 清 从 心 四 母 的 反切 上 字 也 有 分 组 的 趋 
势 , 但 高 氏 为 了 顾全 自己 的 体系 ,并 没有 把 它们 分 为 两 类 (因为 他 已 
经 把 章 . 昌 、. 船 . 书 4 母 拟 测 为 ts”(t7)， 就 不 能 再 把 精 组 各 母 分 为 单 


@ 详 见 徐 通 铺 (1991) ,第 141 一 :142 页 。 
四” 详 见 赵 元 任 (1931 久 《反切 语 八 种 》, 中 央 研 究 院 人 历史 语言 研究 所 集刊 ) 二 本 三 分 。 
图 “ 详 见 高 本 汉 (1940) ,第 28 一 30 页 。 
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纯 的 ts 和 j 化 的 tsj 两 类 了 )。 这 引起 了 学 术 界 的 争论 和 批评 。 对 
此 , 赵 元 任 的 见解 是 ,关于 高 本 汉 的 纯 声 母 和 j 化 声母 ,我 们 用 介 音 
和 谐 的 概念 来 代替 j 化 的 概念 。 原 则 是 这 样 的 ,韵母 以 闭 i 开始 的 
字 , 它 的 反切 上 字 的 韵母 趋 于 以 闭 1 开始 ,韵母 以 开 i 或 其 他 元 音 开 
始 的 字 , 它 的 反切 上 字 的 韵母 也 趋 于 以 开 i 或 其 他 元 音 开 始 ” .中 后 
来 , 李 荣 (1952) 在 此 基础 上 进一步 作 研 究 ,终于 使 这 一 点 成 为 定论 : 
高 本 汉 把 4 切 韵 》 的 声母 分 成 单纯 和 j 化 两 类 是 没有 根据 的 .9 


7 精 研 语法 “” 功 盖 后 世 


1948 年 , 赵 元 任 先 生出 版 (国语 人 门 》%Manrcdarim Primaer， 再 ar- 
vard University Press) 。 后 来 , 李 荣 先 生 把 其 中 跟 语法 有 关 的 部 分 
编译 为 《北京 口语 语法 》( 开 明 书 店 ,1952 年 )。 这 称 得 上 是 中 国 第 一 
部 尝试 运用 结构 主义 语言 学 的 方法 研究 汉语 语法 的 著作 ,在 语法 分 
析 的 理论 方法 和 体系 上 ,对 以 后 的 汉语 语法 研究 产生 了 极为 深远 的 
影响 。 

赵 元 任 1965 年 试 版 (pre-edition)、1968 年 正式 出 版 (中 国 话 的 
文法 》(A Gramaar of Sbpokem Chizese ，University of California 
Press) 。 该 书 采 用 美国 描写 语言 学 的 理论 和 方法 来 全 面 而 系统 地 描 
写 和 分 析 现代 汉语 语法 ,材料 丰富 方法 严谨. 论述 精 到 、 体 系 分 明 。 
全 书 分 八 章 ,依次 为 : 序 论 .句子 . 词 和 语素 形态 类 型 、 句 法 类 型 、 复 
合 词 .词类 和 体 词 .动词 和 其 他 词类 。 基 本 上 重 词法 、 轻 句法 。 在 语 
法 分 析 的 方法 上 ,该 书 以 直接 成 分 分 析 法 作为 分 析 语法 结构 的 主要 
方法 ,使 语言 结构 的 层次 观念 在 汉语 语法 学 界 更 加 深入 人 心 。 并 且 ， 
使 得 诸如 直接 成 分 \. 开 放 类 和 封闭 类 自由 形式 和 黏着 形式 、 向 心 结 
构 和 离心 结构 、 结 合 面 的 宽 或 窑 等 ,成 为 汉语 语法 描写 不 可 缺少 的 内 
容 。 在 语言 材料 的 选取 方面 ,该 书 主要 依据 北京 方言 ,而 且 是 大 量 采 


四 见 赵 元 任 (1941) Distinctions within Ancient Chinese, 刊 瓦 arvuara Joxrzal o 丰 
Asiatic Studies( 哈 佛 燕 京 学 报 ) ,第 五 卷 第 2 期 ,第 214 页 。 
@“ 详 见 徐 通 销 (1991) ,第 132 一 134 页 ; 李 荣 (1956) ,第 107 一 110 页 。 
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用 非 正 式 的 日 常 口语 ;这 跟 过 去 注重 古代 汉语 或 现代 书面 语 的 传统 
很 不 一 样 , 更 多 地 体现 了 美国 描写 语言 学 派 的 精神 。 正 因为 赵 元 任 
注重 口语 ,因而 他 在 语法 分 析 中 就 特别 重视 语音 特征 ,关注 语法 和 语 
音节 律 的 关系 。 该 书 除 了 开头 专 辟 一 节 讲 汉语 语音 外 ,在 讨论 词 、 
结构 、 复 合 句 等 的 定义 时 引入 语音 特征 ,随时 讨论 停顿 .轻重 音 、 升 降 
调 对 语法 的 影响 。 在 讨论 的 时 候 , 不 断 地 拿 其 他 汉语 方言 跟 北京 话 
作 比 较 , 拿 英语 、 德 语 等 外 语 跟 汉语 作 比 较 , 颇 具 理 论语 言 学 的 特色 。 
该 书 一 方面 注重 不 同 语言 的 共性 ,同时 不 抹杀 汉语 语法 的 特点 ;提出 
了 汉语 的 主语 和 谓语 是 话题 和 说 明 的 观点 ` 句 子 可 以 有 大 主语 和 人 小 
主语 、 一 个 整 句 可 以 由 两 个 零 句 构成 、 动 词 可 以 作 主 语 等 观点 ,对 后 
来 的 汉语 语法 研究 产生 了 深远 而 重要 的 影响 。 在 词类 划分 上 ,该 书 
根据 语法 功能 来 分 别 词类 ;基本 的 出 发 点 是 :语法 描写 的 很 大 一 部 
分 是 语言 形式 的 分 类 ”(p. 2) “语法 是 研究 一 类 一 类 的 形式 出 现 或 不 
出 现在 由 别 的 类 构成 的 框架 或 槽 之 中 的 ”(p. 5); 明 确 地 指出 词类 划 
分 的 原则 是 功能 ,说 “形式 类 是 语言 形式 按 其 功能 分 的 类 ,…… 一 个 
词类 是 一 个 其 成 员 都 是 词 的 形式 类 ”(p. 496) 。 他 坚定 地 按 分 布 了 给 
词语 分 类 ,根据 分 布 为 每 一 类 词 下 了 严格 的 定义 ,这 种 做 法 跟 以 前 的 
汉语 语法 著作 有 很 大 的 不 同 。 在 具体 分 类 上 ,他 把 体 词 分 为 名 词 、 专 
名 、 处 所 词 . 时 间 词 “限定 词 十 量词 ?复合词 ( 三 斤 . 这 回 ) “名 词 十 定 
位 词 ” 复 合 词 ( 墙 上 、 饭 前 )、 限 定 词 ( 三 ,每 ) 量词. 定位 词 ( 里 .上 )、 代 
名 词 ( 我 ,什么 )。 对 于 量词 .助动词 .介词 等 封闭 类 , 尽 可 能 穷尽 地 列 
举 其 成 员 ,一 一 描写 它们 的 功能 和 用 法 。 这 些 也 都 是 以 往 所 没有 的 。 
尤其 是 对 语 助词 的 分 析 ,观察 细致 人 微 、 描 写 准 确 周 到 。 值 得 一 提 的 
是 , 赵 元 任 对 等 各 种 理论 ,方法 和 语言 现象 ,总 是 持 一 种 开放 、 通 达 、 
适度 的 态度 。 比 如 ,在 语法 分 析 时 ,他 接受 结构 主义 的 思想 ,注重 对 
语言 的 形式 分 析 ; 但 是 “并 不 取消 意义 的 用 处 ”(p. 7) ,在 说 明 一 个 词 
语 表 达 的 意义 时 经 常 联 系 词 语 使 用 的 环境 。 对 一 句 话 能 不 能 说 ,经 
常 不 作 绝对 判断 ;而 是 注 明 在 什么 场合 下 什么 样 的 人 这 么 说 。 他 承 
认 许 多 语法 现象 是 个 程度 问题 或 频率 问题 。 他 虽然 接受 结构 主义 的 
理论 ,但 是 立论 通达 ,从 不 拿 事 实 迁 就 理论 。 他 说 :在 语言 现象 中 寻 
找 系统 性 和 对 称 性 在 方法 学 上 是 可 取 的 ,只 要 不 走 得 太 远 ”(p. 9 一 
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10)。 因 此 ,他 在 寻找 语法 的 系统 性 和 对 称 性 的 同时 ,又 注意 不 对 称 
的 一 面 和 扭曲 关系 ,充分 尊重 语言 事实 。 作 为 例证 ,他 指出 :虽然 在 
真正 的 动 宾 结 构 中 ,重音 总 是 落 在 宾语 上 ;可 是 ,重音 在 第 二 音节 上 ， 
并 不 一 定 都 是 动 宾 结 构 。 比 如 ， 烙 ? 饼 ` 炒 ?* 饭 ?在 语法 上 是 两 可 的 ， 
动词 可 以 拿 名 词 作 宾语 ,也 可 以 修饰 它 。 这 就 是 扭曲 关系 , 即 一 种 有 
时 规则 和 对 称 ` 有 时 不 规则 和 不 对 称 的 现象 。 

总 的 来 说 《中 国 话 的 文法 》 系 统 地 运用 结构 主义 语言 学 的 方法 ， 
对 汉语 语法 事实 进行 了 全 面 的 描写 和 精 到 的 分 析 , 使 得 该 书 至 今 仍 
是 国内 外 引用 最 多 的 汉语 语法 著作 。 甚 至 可 以 说 ,无 论 从 涉及 的 语 
法 事实 的 广度 .分 析 的 深入 和 细 典 ,还 是 从 理论 和 方法 的 建树 上 ,将 
近 40 年 后 的 今天 ,还 没有 一 部 汉语 语法 著作 能 全 面 地 超过 它 。 


8 提升 理论 ”回馈 世界 


在 长 期 的 汉语 方言 调查 的 基础 上 , 赵 元 任 对 音 位 学 理论 进行 了 
深入 的 研究 , 写 出 了 《 音 位 标 音 法 的 多 能 性 》(1934)。 文 章 阐明 从 语 
音 材料 归纳 音 位 系统 时 可 以 有 多 种 选择 ,答案 不 是 唯一 的 。 而 影响 
答案 的 因素 有 :(1) 音 位 的 尺寸 问题 ,比如 把 塞 探 音 Ltj，d5，tg] 等 看 
作 一 个 音 位 可 能 是 分 析 不 足 , 而 看 作 两 个 音 位 (塞音 和 拉 音 ) 可 能 是 
分 析 过 头 ;(2) 组 类 问题 ,把 哪些 音 归 纳 为 一 个 音 位 会 受到 下 列 因 素 
的 影响 :(a) 音质 的 准确 度 ,(b) 系统 的 简单 或 对 称 的 要 求 , (c) 本 地 
人 对 于 音 类 的 见解 , Cd) 字源 的 顾及 ……- (3) 符号 的 选择 ,由 于 语 
音符 号 的 使 用 有 不 少 互相 冲突 的 传统 ,因而 音 位 归纳 时 常常 要 放弃 
其 他 方面 的 考虑 来 迁就 现成 的 某 套 符号 .由 文章 立论 通达 ,用 例 恰 
切 ,成 为 音 位 学 理论 的 经 典 文献 ,一直 为 各 国语 言 学 家 广泛 引用 。 美 
国语 言 学 家 硝 斯 (M,Joos) 在 Reaaizgsiz 工 iaguistics : 太 e Develozp- 
11ae2t 0O 太 Descrziptiive 工 12g2Ui5tics 2172 Azerica Si7ce 1925(《 语 言 学 选 


读 一 一 1925 年 以 来 美国 描写 语言 学 的 发 展 》, American Council of 


中 详 见 赵 元 任 (1934) The Non-unidqueness 误 Phonemic Solution of Phonetic Sys- 
tems, 中 央 研 究 院 《历史 语言 研究 所 集刊 } 四 本 四 分 。 
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Learned Societies，1957) 中 收录 了 此 文 , 并 作 了 简短 的 评论 ,其 中 说 
到 “我 们 很 难 想到 有 比 赵 元 任 的 这 篇 文章 更 好 的 对 早期 音 位 学 具有 
指导 意义 的 单 篇 论文 了 ”。 

值得 一 提 的 是 , 赵 元 任 在 语音 分 析 的 实践 中 , 赁 着 自己 的 声学 和 
音乐 修养 ,精心 设计 了 一 套 五 度 制 的 标 调 字母 ,9 为 记录 和 研究 汉语 
以 及 世界 上 其 他 有 声调 的 语言 提供 了 准确 方便 的 工具 ,为 世界 语言 
学 界 普 遍 采 用 。 

1959 年 ,2 月 2 日 至 4 月 1 日 , 赵 元 任 应 邀 到 台湾 大 学 文学 院 中 
文系 作 “ 语 言 问 题 ? 系 列 演讲 (16 讲 ) ,并 由 台湾 大 学 文学 院 出 版 专著 
《语言 问题 》。 后 来 ,他 把 这 部 书 改写 成 英文 本 的 Eazguage aziz 
Sy7apolic Syste2s (语言 和 符号 系统 》， Carmbridge University 
Eress，1968) 。《 语 言 问 题 》 于 1980 年 又 由 商务 印 书馆 出 了 新 版 。 
《语言 问题 }》 是 他 系统 地 讲述 语言 学 以 及 相关 的 问题 的 演讲 记录 。 他 
用 风趣 的 语言 .丰富 而 生动 的 例子 阐明 深刻 的 见解 ,先后 被 翻译 为 法 
语 西班牙 语 、 葡 萄 牙 语 和 日 语 。 

赵 元 任 能 取得 这 么 大 的 成 就 ,固然 与 他 天 资 聪慧 :工作 勤奋 有 
天, 但 更 主要 的 一 点 是 赵 先生 具有 极为 广阔 的 学 术 背 景 , 可 以 概括 
为 :融会 古今 贯通 中 外 、 横 跨 文 理 、 精 通 音 乐 。 赵 先生 从 幼年 开始 请 
习 四 书 五 经 ,对 许多 中 国 古 代 典 籍 烂熟 于 心 ,这 一 点 只 消 看 一 下 赵 先 
生 著 作 中 信 手 持 来 的 引经据典 就 足够 了 了 。 赵 元 任 年 轻 时 听 过 著名 语 
言 学 家 J. Vendryes、Daniel Johns 和 汉学 家 伯 希 和 、 马 伯乐 等 人 的 
课 , 还 与 美国 描写 语言 学 派 的 代表 人 物 Edward Sapir、Leonard 
Bloomfield、Bernard Bloch ,Charles F. `Hockaett 等 人 讨论 过 语言 学 
问题 ,对 中 外 学 术 思 想 有 深刻 的 领会 。 加 上 赵 先 生 游历 广泛 , 走 到 哪 
多 学 哪儿 的 话 , 并 且 学 哪儿 的 话 象 哪儿 的 话 。 先 后 学 会 了 英语 、 法 
语 、 德 语 等 多 种 语言 和 汉语 的 北京 话 、 常 州 话 、 苏 州 话 、 常 熟 话 .南京 
话 、 福 州 话 、 上 海 话 .无 锡 话 、 湖 北 话 …… 旋 至 “中 国 主 要 的 方言 系 中 
每 一 系 都 会 说 一 种 ”, 丰 富 的 语言 经 验 为 赵 先 生 的 语言 研究 提供 了 不 


@ 详 见 赵 元 任 (1930) A System of Tone Letters,Le Maizyre 了 hoza6liqze ,troisieme 


serie,no,30, Avril-Juin 。 
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尽 的 源头 活水 。 清 华 大 学 早年 倡导 兼 通 古 今 中 外 的 学 术 风 格 , 与 赵 
元 任 同 时 作 清华 (国学 ) 研 究 院 导师 的 梁启超 .王国 维 、 陈 寅 恪 诸 公 ， 
莫不 做 到 古今 中 外 融会 贯通 。 在 赵 先 生 身 上 ,还 多 出 横 跨 文理 这 一 
层 特 色 。 赵 元 任 先生 上 大 学 时 专修 数学 ,攻读 博士 学 位 时 专修 哲学 ; 
博士 论文 是 关于 数理 逻辑 和 方法 论 的 ,题目 是 Continuity: A Study 
of Methodology(《 连 续 性 一 一 方法 论 的 研究 》》。 毕 业 后 ,他 在 康 奈 
尔 大 学 教 过 物理 ,对 声学 方面 特别 感 兴趣 。 和 良好 的 数理 修养 着 实 为 
赵 先 生 从 事 语音 的 实验 研究 提供 了 利器 ,使 得 赵 先 生 能 掌握 技术 性 
很 强 的 信息 论 ,并 能 从 信息 论 的 立场 来 分 析 语言 现象 。 更 为 重要 的 
是 ,文理 兼 通 的 知识 结构 ,使 赵 先 生 能 够 很 及 时 地 汲取 当代 自然 科学 
的 理论 营养 ,形成 新 型 的 思维 方式 。 比 如 ,在 《说 清 浊 》 中 , 赵 先生 主 
张 清 浊 只 用 于 指 声母 是 不 带 音 ( 清 ) 或 带 音 ( 浊 ) 的 ,因为 这 种 用 法 符 
合 人 的 音 感 :不 带 音频 率 高 , 听 起 来 觉得 清 ; 带 音频 率 低 , 听 起 来 觉得 
浊 。 但 赵 先 生 并 不 认为 这 种 用 法 就 是 完美 的 名 符 其 实 , 因 为 清音 是 
音 ,频率 带 杂 乱 不 清 ; 浊 音 是 乐音 ,频率 带 十 分 清楚 。 这 样 ,从 不 带 
音 和 带 音 的 声学 特征 上 看 , 清 与 浊 这 对 名 称 好像 用 颠倒 了 。 怎 么 办 
呢 ? 还 走 看 看 赵 先 生 的 解释 : 
可 见 音 分 voiceless,voiced 并 不 是 唯一 的 主要 的 发 音 方 法 
的 分 别 , 以 清 浊 的 名 词 来 配 Voiceless,Voiced 也 只 是 为 求 远 辑 
上 的 整齐 方便 ,也 不 是 天 经 地 义 。 大 凡 一 种 理论 求 其 整齐 紧凑 
就 可 能 只 照顾 到 事实 的 一 部 ,一 方面 ;如 果 求 其 包括 的 事实 丰 
富 , 多 方面 来 照顾 ,系统 就 不 免 会 松弛 下 来 。 这 也 是 丹麦 的 
Niels Bohr 教授 常常 讲 的 对 补 原 则 (principle of complementar- 
ity)。 这 本 来 是 讲 质子 的 动量 与 地 位 之 间 的 相互 关系 ,可 是 
Bohr 给 它 推广 了 用 在 好 多 问题 上 。 
这 就 涉及 到 上 世纪 二 三 十 年 代 发 生 在 量子 物理 学 界 的 一 场 观 念 革 
命 : 海 森 堡 (Heisenberg) 发 现 了 测 不 准 关系 ,大 意 是 由 于 微观 粒子 具 
有 波 粒 两 象 性 ,我们 不 能 同时 准确 地 测定 粒子 的 位 置 和 动量 ,两 者 总 
是 存在 着 不 确定 性 一 一 如 果 决 定 粒子 的 坐标 越 准确 ,那么 决定 粒子 
在 该 坐标 方向 上 的 动量 分 量 的 准确 度 就 越 差 ;反之 亦 然 。 对 此 , 玻 尔 
(Bohr) 创 造 了 一 种 全 新 的 逻辑 工具 叫做 互补 性 (complementarity) 。 
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互补 性 代表 一 些 概念 之 间 一 种 完全 新 型 的 逻辑 关系 :这 些 概念 是 互 
斥 的 ,从 而 不 能 同时 被 考虑 , 因为 那 将 导致 允 辑 上 的 错误 ;但 是 ,为 了 
对 现象 作出 一 种 完备 的 描述 ,这 些 概念 又 全 都 是 必需 的 。 互 补 性 引 
入 了 一 种 把 我 们 的 概念 安排 在 里 面 的 逻辑 构架 ,意味 着 我 们 在 谈论 
自然 现象 的 方式 上 的 一 种 巨大 的 扩充 。 量 子 力 学 在 很 大 程度 上 改变 
了 我 们 对 世界 的 固有 看 法 。 赵 元 任 又 得 风气 之 先 ,用 这 种 新 型 的 眼 
光 看 待 语言 学 问题 ,高 人 一 筹 。 赵 元 任 是 一 个 多 方面 的 学 者 , 深 淇 的 
音乐 造 放 又 为 赵 先 生 精 细 的 听 音 、 辩 音 和 声调 .语调 研究 提供 了 得 天 
独 厚 的 助 益 。 

从 上 面 的 介绍 可 以 看 出 , 赵 元 任 的 语言 学 研究 具有 贯通 中 西 . 融 
会 古今 的 学 术 品 格 。 一 方面 ,积极 地 引进 西方 先进 的 现代 语言 学 理 
论 和 方法 ,并 深 深 地 植 根 于 汉语 的 土壤 中 ;同时 努力 地 利用 中 国 传统 
学 问 中 的 各 种 材料 ,来 建设 富有 时 代 气 息 和 民族 特色 的 中 国 现代 语 
言 学 。 另 一 方面 ,通过 以 现代 语言 学 为 指导 的 汉语 方言 调查 和 研究 ， 
为 中 国 传统 音韵 学 研究 摆脱 危机 提供 了 丰富 的 新 鲜 材 料 , 同 时 ,在 研 
究 汉 语 的 实践 中 不 断 地 总 结 经 验 ,并 提升 到 普 语 言 学 理论 的 层面 上 
进行 概括 ,主动 地 证 中 国语 言 学 回馈 世界 语言 学 。 正 因为 这 样 ,他 的 
音 位 学 理论 使 中 国语 言 第 一 次 对 普通 语言 学 产生 影响 。 从 而 改变 了 
中 国语 言 学 一 向 自立 门户 ,游离 于 普通 语言 学 之 外 的 局 面 。 现 在 , 王 
士 元 (美国 加 州 大 学 伯克利 分 校 语 言 学 系 教授 ) 等 一 批 在 美的 华裔 语 
言 学 家 ,通过 研究 汉语 方言 中 的 扩散 性 音 变 的 各 种 复杂 情况 ,提出 了 
著名 的 词汇 扩散 理论 (lexical diffusion theory) ,在 世界 上 的 历史 语 
言 学 界 产生 很 大 的 影响 ,从 而 使 中 国语 言 学 第 二 次 对 普通 语言 学 作 
出 杰出 的 贡献 。 

从 中 我 们 得 到 的 启发 是 :只 有 真正 贯通 中 西 .融会 古今 的 学 术 研 
究 , 才 能 走出 国门 . 汇 人 世界 学 术 的 洪流 。 


鸣谢 : 本 文 为 清华 学 校 (国学 ) 研 究 院 成 立 70 周年 纪念 会 而 作 ， 
写作 时 蒙 张 清 常 先生 慨 借 赵 元 任 制 的 《 方 音调 查 字 表 》(1930) ,说 此 


@ 详 见 王 土 元 (1982) 语 言 变 化 的 词汇 透视 》《 语 言 研究 } 第 2 期 。 
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朱德 早先 生 评 传 


1 坚忍 好 学 的 人 生 “卓越 辉煌 的 成 就 " 


代 , 他 在 父母 的 督促 下 练 毛笔 字 、 背 诵 古文 和 诗词 ,接受 中 国 传统 的 
人 文教 育 ; 十 一 二 岁 就 开始 阅读 4 三 国 演 义 兴 西游 记 兴 水 洲 传 兴 镜 花 
缘 } 等 古典 小 说 ,还 翻阅 了 二 十 余 本 一 套 的 《历朝 通俗 演义 》( 自 两 汉 
至 民国 元 年 ), 在 修 习 中 国 传统 文化 的 同时 养 成 了 读书 自学 的 好 习 
惯 。 同 时 ,他 主动 地 接受 新 文化 的 洗礼 ,阅读 鲁迅 的 (狂人 日 记 》 巴 
金 的 (新生 兴 灭 亡 兴 家 兴 春 兴 秋 》、 苏 联 革命 年 代 的 小 说 《 表 兴 面包 》 
《 士 敏 土 》 艾 思 奇 的 (大 众 哲 学 》 斯 诺 的 《西行 漫 记 》 以 及 德国 柯 勤 惠 
支 的 版 画 等 ,努力 地 接受 进步 思想 的 启蒙 和 教育 。 他 早年 曾 在 南京 
钟 英 中 学 ` 上 海 正 始 中 学 、 上 海 大 同 大 学 附中 读书 ,期 间 满 怀 爱 国 热 
情 地 投入 上 海 的 抗日 救亡 运动 ,不 仅 参 加 了 示威 游行 ,还 跟 同 学 二 起 
参加 *“ 赴 京 请 愿 团 ? 到 南京 请 愿 ,被 军 警 在 无 锡 拦 截 . 押 送 回 上 海 。 可 
见 , 先 生年 轻 时 并 不 只 是 一 个 埋头 读书 的 书生 ,而 且 是 一 个 热爱 国 
家 、 关 心 政治 .并 且 勇 于 投身 社会 的 热血 少年 。 

1939 年 ,朱德 黑 先 生 考取 昆明 西南 联合 大 学 物理 系 , 比 杨振宁 
先生 低 一 班 。 后 来 ,由 于 受到 清华 大 学 哲学 系 研 究 生 朱 南 跳 和 徐 孝 
通 的 影响 和 启发 ,于 第 二 年 (1940 年 9 月 ) 转 入 中 文系 学 习 。 在 中 文 
系 学 习 期 间 , 他 受到 了 罗 常 培 . 唐 兰 、 陈 梦 家 等 教授 的 教导 和 赏识 ,学 
问 进步 很 快 。 期 间 休学 过 两 年 ,延至 1945 年 毕业 。 毕 业 后 ,先生 曾 
在 昆明 中 法 大 学 中 文系 任教 ,并 加 入 了 中 国民 主 同盟 。1946 年 应 清 


@ 这 一 部 分 主要 参考 (朱德 黑 先 生 纪 念 文集 并 语 文 出 版 社 ,1993 年 ) 中 的 《朱德 照 先 
生生 平 六 李 荣 《 朱 德 黑 》 朱 德 能 等 4 忆 大 哥 》 等 文章 。 
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华 大 学 中 文系 主任 闻 一 多 先生 的 聘请 ,去 清华 大 学 中 文系 任教 。 
1952 年 , 因 院 系 调整 先生 调和 人 北京 大 学 中 文系 工作 ,并 应 邀 赴 保 加 
利 亚 索菲亚 大 学 任教 。1955 年 回国 ,此 后 他 一 直 在 北京 大 学 中 文系 
工作 1979 年 晋升 为 教授 。 朱 德 黑 先 生 先 后 担任 过 北京 大 学 中 文系 
副 主任 ,北京 大 学 计算 语言 学 研究 所 所 长 ,北京 大 学 副 校长 兼 研究 生 
院 院 长 ,中国 语言 学 会 副 会 长 会 长 ,世界 汉语 教学 学 会 会 长 兼 4 世 界 
汉语 教学 ?主编 ,中 国 古 文字 研究 会 理事 ,国务 院 学 位 委员 会 委员 , 国 
家 语言 文字 工作 委员 会 委员 ,国务院 古 籍 整理 规划 小 组 顾问 ,中 国 大 
百科 全 书 总 编辑 委员 会 委员 ,第 五 .六 届 中 国民 主 同 盟 中 央 委 员 会 委 
员 ,第 六 七 届 全 国人 民 代表 大 会 代表 ,第 七 届 全 国人 民 代表 大 会 常 
务 委员 会 委员 文教 委员 会 委员 等 职 。 在 这 繁重 的 社会 活动 之 外 ,他 
仍 孜 孜 不 倦 地 从 事 学 术 研 究 和 教学 工作 ,并 不 断 有 令 人 耳目 一 新 的 
成 果 问 世 。 

朱德 中 先 生 以 其 精湛 的 汉语 语法 和 古文 字 方 面 的 研究 成 果 而 茧 
声 于 国内 外 的 汉语 语言 学 界 ,除了 保加利亚 之 外 ,还 先后 赴 美 国法 
国 、 泰 国 、 香 港 、 新 加 坡 、 澳 大 利 亚 等 国家 和 地 区 讲学 ` 合 作 研究 或 出 
席 国际 会 议 。1986 年 ,法国 巴黎 第 七 大 学 授予 他 荣誉 博士 学 位 。 

朱德 如 先 生 为 人 谦虚 方正 耿直 又 不 失 厚 道 , 他 思想 开阔 、 兴 趣 
广泛 :一 方面 学 习 国 外 先进 的 语言 学 理论 和 方法 , 另 一 方面 熟 读 中 国 
古书 、 研 究 古 文字 ;一 方面 潜心 学 术 研究 , 另 一 方面 唱 昆 曲 、 吹 笛子 ， 
既 会 研究 又 会 娱乐 。 先 生 热 爱 教育 事业 ,不断 地 奖 掖 后 进 , 培 养 了 一 
大 批 优秀 的 汉语 语言 学 研究 和 教学 人 才 。 

1991 年 12 月 ,朱德 咎 先生 病 重 , 被 确诊 为 不 治之 症 。1992 年 7 
月 19 日 清晨 6 时 6 分 ,先生 在 美国 斯 坦 福 大 学 医院 逝世 ,享年 72 
岁 


朱德 申 先 生 的 一 生 坎 坷 多 艰 , 早 年 外 敌人 侵 和 内 战 祸 乱 使 他 其 
沛 流离 .生活 不 宁 , 壮 年 政治 运动 接连 不 断 使 他 没有 平静 的 书 裔 , 晚 
年 病痛 的 折磨 使 他 难以 把 最 后 一 篇 论文 写 完 。 但 是 ,先生 在 艰难 中 
发 奋 读书 .矢志 学 问 .坚韧 不 拔 ,把 生命 融和 学术, 取得 了 令 世 人 瞩目 
的 学 术 成 就 。 
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2 四 十 余 载 治 语法 “为 “的 ” 消 得 人 惟 悖 


1956 年 ,朱德 四 先 生发 表 《 现 代 汉 语 形容 词 研究 》(《 语 言 研究 》 
第 1 期 ) ,全面 而 系统 地 用 分 布 分 析 的 方法 来 说 明 :形容 词 的 简单 形 
式 和 复杂 形式 在 语法 功能 上 有 一 系列 的 区 别 。 所 谓 简 单 形式 , 指 的 
是 形容 词 的 基本 形式 ,包括 单 音节 形容 词 和 一 般 的 双 音 节 形 容 词 。 
例如 ， 
大 、 红 、 多 、 快 好、 干净 、 大 方 、 和 糊涂、 规矩、 伟大 
所 谓 复 杂 形 式 , 指 的 是 形容 词 的 各 种 重 故 形式、 带 后 绥 的 形容 词 、 仿 
正式 的 专 饰 类 的 形容 词 `, 以 形容 词 为 中 心 的 词组 。 例 如 ， 
小 小 儿 , 远 远 儿 \ 老 老实 实 、. 干 干净 净 、 糊 里 糊涂 、 古 里 古怪 、 
黑 乎 乎 、 慢 腾腾 、 脏 里 瓜 哪 、 白 不 峻 列 、 者 白 、 通 红 、 插 好 、 又 高 又 
洪 
为 了 方便 ,文章 称 形 容 词 的 简单 形式 为 甲 类 成 分 , 称 形 容 词 的 复杂 形 
式 为 乙 类 成 分 。 他 指出 ,从 意念 上 看 , 甲 类 成 分 表示 的 是 单纯 的 属 
性 , 乙 类 成 分 表示 的 是 这 种 属性 的 状况 或 情态 . 它 跟 说 话 人 对 于 这 种 
属性 的 主观 估价 作用 发 生 联 系 ( 即 包含 着 说 话 人 的 感情 色彩 在 内 )。 
更 引人入胜 的 是 ,这 种 意念 上 的 区 别 完 整地 反映 在 甲 、 乙 两 类 成 分 的 
语法 功能 上 一 一 不 论 在 什么 样 的 环境 里 ,这 两 类 成 分 始终 表现 着 互 
相对 立 的 倾向 。 文 章 分 别 从 定语 、 状 语 、 谓 语 、 补 语 四 种 位 置 上 来 观 
察 甲 、 乙 两 类 成 分 在 语法 功能 上 的 区 别 : 
第 一 , 甲 类 成 分 充当 的 定语 是 限制 性 的 ,如 在 “ 白 纸 ? 里 ,我 们 用 
“ 白 ” 这 种 属性 来 限制 “ 纸 ? 这 个 类 名 ,得 到 一 个 新 的 类 名 “和 白 纸 ”; 己 
类 成 分 充当 的 定语 是 描写 性 的 ,如 在 “雪白 的 纸 > 里 ,“ 雪 白 的 ”不 是 用 
来 作为 分 类 的 根据 ,而 是 用 来 描写 * 纸 ”的 状况 或 情态 的 。 甲 类 成 分 
充当 的 定语 跟 其 中 心 语 是 互相 选择 的 ,二 者 不 能 任意 替换 ; 乙 类 成 分 
充当 的 定语 跟 其 中 心 语 的 选择 关系 相对 自由 ,只 要 二 者 的 词汇 意义 
不 抵触 就 行 。 例 如 : 
凉水 ~ * 凉 脸 ~ 冰凉 的 脸 
薄 纸 一 * 薄 灰尘 一 薄 薄 的 灰尘 
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第 二 ,由 形容 词 充当 的 状语 表示 的 是 动作 的 方式 或 状态 ,属于 描 
写 性 的 .而 不 是 限制 性 的 。 因 此 , 甲 类 成 分 一 般 不 宜 于 作 状 语 , 而 乙 
类 成 分 (特别 是 其 中 的 重 到 式 ) 则 经 常 担任 状语 这 种 职务 。 

第 三 , 甲 类 成 分 作 谓语 的 句子 ,含有 比较 或 对 照 的 意思 ,因此 往 
往 是 两 件 事 对 比 着 说 的 ; 乙 类 成 分 作 谓 语 的 句子 ,没有 比较 或 对 照 的 
意思 ,因此 可 以 独立 出 现 。 例 如 : 

今 儿 冷 ， 昨 儿 上 暖和。 一 今 儿 怪 冷 的 。 

第 四 , 甲 类 成 分 作 补 语 的 句子 ,含有 比较 或 对 照 的 意思 ,因此 往 
往 是 两 件 事 对 比 着 说 的 ; 乙 类 成 分 作 补 语 的 句子 ,没有 比较 或 对 照 的 
意思 ,因此 可 以 独立 出 现 。 例 如 : 

站 得 高 ,看 得 远 。 一 他 的 嘴 张 得 大 大 的 。 
这 种 形式 跟 意义 互相 渗透 .互相 验证 的 研究 方法 ,是 对 美国 结构 主义 
只 重 形式 、 不 顾 意义 的 重大 改进 。 被 赵 元 任 (1968 欠 中 国 话 的 文法 》 
誉 为 :到 目前 为 止 ,讨论 中 国 形容 词 的 文章 ,最 好 的 还 算 这 一 篇 ” 见 
丁 邦 新 译本 第 566 页 ,河北 教育 出 版 社 ,1996 年 )。 就 在 研究 甲 、 乙 
两 类 形容 词 的 语法 功能 的 差别 时 , 朱 先 生 人 敏锐 地 发 现 :…“ 甲 的 ” 甲 类 
成 分 加 “的 力 跟 * 乙 的 2( 乙 类 成 分 加 “的 2 的 语法 性 质 不 一 样 , 前 者 是 
形容 词性 的 .可 以 受 副 词 的 修饰 ,后 者 是 体 词性 的 .可 以 受 数量 词 或 
指示 词 修 饰 。 例 如 : 

脸 上 永远 红 扑 扑 的 .一 * 脸 上 永远 红 的 

x 一 个 大 大 的 一 一 个 大 的 
进一步 , 朱 先 生发 现 “ 甲 的 ? 跟 * 乙 的 ?中 的 “的 ”虽然 在 形式 上 没有 区 
别 , 但 是 它们 的 语法 性 质 很 不 一 样 :前 者 有 体 词 化 的 作用 ,后 者 没有 
这 种 作用 。 

那么 ,北京 话 里 读 “ 的 ”的 形式 到 底 代表 几 个 语素 呢 ? 对 此 ,朱德 
四 先 生 采 用 严格 的 分 布 分 析 方 法 进行 深入 的 研究 ,并 在 1961 年 发 表 
《说 “的 >》(《 中 国语 文 》12 月 号 ) 中 ,公布 了 这 种 令 人 难以 置信 、 却 又 
不 得 不 相信 的 结论 :通过 比较 不 带 “ 的 ”的 语法 单位 一 一 假定 为 
跟 加 上 “的 ”之 后 的 格式 “x 的 ?在 语法 功能 上 的 差别 ,由 此 分 离 
出 “的 ”的 性 质 来 ; 即 根据 不 同 的 x 加 上 “的 ”之 后 形成 的 格式 (za 
的 ”"、“xs 的 等 ) 在 功能 上 的 区 别 , 把 “的 ” 字 分 析 为 三 个 不 同 的 语素 : 


站 
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“的 ; "是 副词 性 语法 单位 的 后 附 成 分 “副词 十 的 ,” 仍 是 副词 性 的 ， 
即 只 能 作 状 语 。 例 如 : 
天 渐渐 (的 ) 黑 了 忽然 (的 ) 门 被 风 吹 开 了 
“的 :是 形容 词性 语法 单位 的 后 附 成 分 ,可 以 通过 单 音 节 形 容 词 的 重 
琶 形 式 AA( 儿 )( 记 作 R) 来 证 明 。R 分 两 类 ,一 类 一 定 要 后 附 “ 的 ”， 
这 种 信 记 作 R.。“R. 的 ?是 形容 词性 的 ,可 以 单 说 、 作 谓语 、 补 语 、 定 
语 和 状语 。 例 如 
红 红 儿 的 脸红 红 的 抹 得 红 红 的 红 红 的 脸 热 热 的 喝 下 去 
男 一 类 人 只 能 作 状 语 , 是 副词 性 的 , 记 作 Rs 。 但 是 , “Ri 的 ”是 形容 
词性 的 。 例 如 : 
好 好 拿 着 一 什么 都 好 好 的 、 说 得 好 好 的 、 好 好 的 东西 .好 
好 的 拿 着 
可 见 ， 的 :>” 有 把 形容 词 的 重 礁 形式 转变 为 形容 词性 的 语法 单位 的 功 
能 。“ 的 ;” 是 名 词性 语法 单位 的 后 附 成 分 ,形容 词 .动词 .名词 加 上 
“的 : "后 在 语法 功能 上 是 名 词性 的 ,可 以 作 主 语 ` 宾 语 、 定 语 和 体 词性 
谓语 。 例 如 : 
白 的 好 不 要 和 白 的 “， 白 的 纸 这 张 纸 和 白 的 
这 种 把 带 “ 的 ?的 格式 在 语法 功能 上 的 异 或 同 归 结 为 后 附 成 分 
“的 ”的 异 或 同 的 研究 方法 ,引起 了 当时 语言 学 界 极 大 的 关注 和 极为 
激烈 的 争论 。 为 此 , 朱 先 生 在 1966 年 发 表 《 关 于 《说 “的 ”》》(《 中 国语 
文 ) 称 1 期 ) ,一 方面 澄清 各 种 误解 , 另 一 方面 进一步 阐明 这 种 方法 的 
实质 和 根据 。 限 于 当时 的 政治 环境 ,先生 矢口 否认 这 是 描写 语言 当 
派 的 方法 ,声称 这 是 传统 语言 学 对 付 印 欧 语 系 各 种 语言 时 沿用 的 老 
办 法 。 值 得 重视 的 是 ,在 这 篇 文章 中 , 朱 先 生 联 系 历史 ,把 唐 宋 时 期 
带 “ 底 、 地 ”的 格式 分 为 三 类 
(1) xx 底 ”, 它 只 能 作 主 语 、 宾 语 、 表 语 、 定 语 ,不 能 作 状语 ， 
是 名 词性 成 分 ; 
《2) "xx 地?”, 它 能 作 谓 语 、 状 语 . 定 语 , 是 形容 词性 成 分 ; 
《3) x 地 1”, 它 只 能 作 状 语 , 如 “ 陌 地 、. 平 白地 ”, 是 副词 性 成 
2 


据 此 ,他 把 “ 底 `. 地 ?区 分 为 三 个 语素 “地 :是 副词 的 后 附 成 分 “地 ?” 
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是 形容 词 的 后 附 成 分 “ 底 ” 名 词性 单位 的 后 附 成 分 ,并 认为 :现代 汉 
语 的 “的 .的 ,的 :> 是 分 别 从 唐 宋 时 期 的 <“ 地， 地，、 底 ”演变 来 的 , 历 
史 事 实 支持 他 的 这 种 分 析 。 

此 后 ,由 于 “文化 大 革命 ”的 政治 干扰 ,朱德 熙 先生 被 迫 中 断 语法 
研究 ;直至 1976 年 以 后 ,他 才 有 机 会 重新 从 事 语法 研究 。 

1978 年 ,中 国学 术 界 刚 从 十 年 沸 劫 中 苏醒 ,朱德 四 先生 就 在 刚 
复刊 的 (中 国语 文 》( 第 1.2 期 ) 上 发 表 (“ 的 ” 字 结 构 和 判断 句 》 引进 
动词 的 * 向 ”"“ 潜 主语 >“ 潜 宾语 ”等 概念 来 讨论 “的 ” 字 结 构 的 语义 所 
指 和 歧义 指数 .分 析 由 “的 ” 字 结构 组 成 的 五 种 判断 句 。1980 年 , 朱 
先生 发 表 《 北 京 话 、 广 州 话 、 文 水 话 和 福州 话 里 的 “的 ” 字 》(《 方 言 } 第 
3 期 ) ,指出 广州 话 的 三 个 “的 ”读音 不 同 (分 别 写 作 : 哇 、 吨 、 吸 ) ,语法 
功能 不 同 , 显 然 是 三 个 不 同 的 语素 ;北京 话 的 三 个 “的 ”同音 ,分 析 起 
来 要 困难 得 多 ;但 是 ,广州 话 、 文 水 话 和 福州 话 里 “的 ;、 的 ,的 :” 三 分 
的 局 面 以 及 历史 上 “地 ,、 地 。、 底 ”的 区 分 都 支持 他 对 北京 话 的 “的 ”所 
作 的 分 析 ,尽管 这 四 种 方言 里 相对 应 的 “的 ; 、 的 ,` 的 :” 的 来 历 不 一 定 
都 相同 。 也 就 是 说 ,经 过 十 几 年 的 摸索 和 思考 ,先生 终于 找到 了 一 条 
贯通 方言 和 历史 的 现代 汉语 语法 研究 的 路 子 。1983 年 , 朱 先 生发 表 
《 自 指 和 转 指 一 “汉语 名 词 化 标记 “的 者 所、 之 ”的 语法 功能 和 语义 
功能 j《 方 言 ) 第 3 期 ) ,引进 句法 成 分 的 “提取 ”“ 缺 位 "和 名 词 化 形 
式 的 “ 自 指 >“ 转 指 ” 等 概念 ,分 析 了 现代 汉语 的 “的 ?和 古 汉语 的 “者 、 
所 、 之 ”等 名 词 化 标记 的 性 质 , 并 且 从 语法 功能 和 语义 功能 两 方面 比 
较 了 它们 的 异同 。1991 年 , 朱 先 生 写成 4 的” 字 的 方言 比较 研究 》9 
利用 汉语 18 个 方言 点 的 材料 ,讨论 状态 词 的 名 词 化 “的 ;,” 和 “的 ,、 
的 ”的 关系 .状态 词 的 名 词 化 形式 的 指称 功能 和 陈述 功能 .有 没有 专 
作 定语 标 记 的 “的 ,”、 文 章 还 利用 《 祖 堂 集 》 等 新 语 料 对 “地 、 底 ”的 分 
布 及 甚 跟 * 的 ,的 ,的 :” 的 源流 关系 进行 了 考察 。 

1992 年 ,在 生命 的 最 后 岁月 ,朱德 申 先 生 强 忍 着 病痛 ,在 (“ 的 ” 


@ 该 文 曾 以 (汉语 助词 “的 ”的 跨 方 言 比较 研究 》 为 题 , 提交 在 康 乃 尔 大 学 举行 的 第 
三 届 北 美洲 汉语 语言 学 会 议 (1991 年 5 月 3 日 一 5 日 )。 关 于 这 次 会 议 , 请 看 《国外 语言 
学 》1991 年 第 4 期 的 会 议 报 道 ( 第 44 一 45 页 ) 。 
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字 的 方言 比较 研究 》 这 篇 文章 的 基础 上 撰写 4 从 方言 和 历史 看 状态 形 
容 词 的 名 词 化 兼 论 汉 语 同位 性 偏 正 结构 》( 未 完成 稿 ,发 表 在 (方言 》 
1993 年 第 2 期 ) 。 文 章 考察 了 分 属 六 个 大 方言 区 的 十 种 方言 里 的 状 
态 形容 词 的 后 缀 ( 即 的 ,) 的 语音 形式 .语法 分 布 及 其 名 词 化 时 与 名 词 
化 标记 ( 即 的 ; ) 的 组 合 关系 。 文 章 着 重 指出 :(1) 在 那 十 种 方言 里 ， 
状态 形容 词 充任 定语 时 必须 通过 加 “的 :” 的 办 法 名 词 化 ;由 于 “的 ,” 
除了 有 和 名词 化 的 功能 外 ,还 有 语义 上 的 转 指 功能 ,这 样 造成 的 偏 正 结 
构 都 是 同位 性 的 。(2) 同位 性 偏 正 结构 在 现代 汉语 各 类 名 词性 偏 正 
结构 里 所 占 的 比重 极 大 ,这 种 局 面 开 始 形成 于 唐 宋 之 际 * 者 字 妨 变 
为 “ 底 ” 字 的 时 期 ;由 “ 底 ” 字 组 成 的 新 的 同位 性 偏 正 结构 的 兴起 是 汉 
语 语法 史上 的 一 件 大 事 。 尽 管 先生 没 来 得 及 写 出 对 同位 性 偏 正 结构 
的 全 部 见解 ,但 是 他 还 是 先 写 出 了 余 论 ,对 自己 三 十 多 年 研究 “的 ” 字 
的 经 历 和 得 失 作 了 一 番 发 人 深 省 的 总 结 :1961 年 写 ( 说 “的 ”》 时 没 想 
到 跟 广州 话 等 方言 作 比较 ,否则 很 容易 得 到 “的 ” 字 应 该 三 分 的 结论 ; 
当时 批评 《说 “的 ”》 的 文章 也 只 是 说 它 不 提 历 史 、 不 说 它 不 提 方 言 , 因 
为 那 时 很 多 人 心目 中 都 没有 方言 语法 比较 这 回 事 ;1980 年 写 人 北京 
话 \ 广 州 话 , 文 水 话 和 福州 话 里 的 “的 ” 字 》 主要 是 想 说 明 方言 事实 也 
支持 6 说“ 的?》 的 分 析 , 却 发 现 了 方言 里 状态 形容 词 修饰 名 词 的 时 候 
要 名 词 化 的 事实 ,但 没 想到 应 该 回头 去 考察 历史 ,看 看 这 个 现象 在 文 
献 里 是 否 有 反映 ;直到 1989 年 重新 拣 起 这 项 工作 时 才 去 查考 历史 ， 
结果 发 现 历史 事实 跟 方言 情况 完全 一 致 一 一 状态 形容 词 作 定语 的 时 
候 也 必须 名 词 化 。 经 过 这 三 十 年 的 循环 , 朱 先 生 对 方言 语法 研究 、 历 
史 语 法 研究 和 标准 语 语法 研究 的 密切 关系 最 终 有 了 深切 的 体会 ,并 
用 这 篇 生命 的 压轴 之 作 向 学 术 界 展示 这 种 远见 卓识 。 

纵 观 朱德 早先 生 一 生 中 一 些 主要 的 研究 课题 ,我 们 可 以 发 现 它 
们 大 多 跟 * 的 ” 字 相关 ;一 个 小 小 的 “的 > 字 ,牵动 着 汉语 语法 的 全 局 ， 
耗 尽 了 先生 毕生 的 心血 .9 


OO 朱德 辕 先 生 说 :我 写 一 千 字 ,起 码 要 用 掉 两 三 千 字 的 稿子 ,一 篇 文章 写 完 ,就 像 
是 得 过 一 场 病 似 的 ”( 见 《朱德 中 先 生 纪念 文集 》 中 林 奏 先生 的 《4 避 德 中 兄 》, 第 86 页 ) 。 这 
大 概 可 以 作为 我 们 这 儿 几 句 话 以 及 本 节 标 题 的 脚注 。 
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3 和 亿 路 蓝 缕 辟 蹊 径 ” 融 汇 中 西 铸 新 篇 ” 


50 年 代 初 ,朱德 申 先 生 跟 吕 叔 湘 先 生 合 写 (语法 修辞 讲话 》 
(1951 年 6 月 5 日 起 在 (人 民 日 报 》 连 载 )。 从 此 , 朱 先 生 把 很 大 的 时 
间 和 精力 投放 到 语法 研究 上。 在 进行 语法 研究 的 实践 中 , 朱 先 生 努 
力 从 汉语 语法 的 事实 出 发 ,吸收 国外 结构 主义 语言 学 的 新 理论 .采用 
美国 描写 语言 学 的 新 方法 ,不断 地 探索 汉语 语法 研究 的 新 途径 、 开 辟 
汉语 语法 研究 的 新 领域 .并 逐步 创立 汉语 语法 学 的 新 体系 。 先 生 在 
1956 年 的 4 现代 汉语 形容 词 研究 》 中 ,已 经 全 面 而 系统 地 用 分 布 分 析 
的 方法 来 证 明 形容 词 的 简单 形式 和 复杂 形式 在 语法 功能 上 有 一 系列 
的 区 别 ,为 对 汉语 语法 现象 进行 分 布 分 析 作 出 了 示范 。 在 1961 年 的 
《说 “的 ”》 中 ,先生 更 是 把 分 布 分 析 的 效用 推 到 了 极致 ,把 一 个 普通 常 
用 的 “的 ”区 分 为 功能 授 异 的 三 个 语素 ,这 种 结论 一 方面 使 人 难于 接 
受 ,一 方面 又 使 人 不 得 不 信服 ,着 实 是 令 人 耳目 一 新 。 更 有 意思 的 
是 ,在 1966 年 发 表 ( 关 于 《说 “的 ”>》 中 ,先生 在 说 明 研究 方法 时 ,把 结 ， 
构 语法 学 的 分 布 分 析 方 法 跟 传 统 语法 的 渊源 关系 交代 得 清 清楚 楚 : 
英语 合成 词 xly 有 副词 (如 :partly，roughly，determinedly) 形容 
词 ( 如 :cowardly,，lowly) 两 种 词类 ,其 中 的 x 有 名 词 ( 如 :part，cow- 
ard) 形容 词 ( 如 :rough，low) .动词 (如 :determined) 三 种 词类 ;如 果 
根据 x 的 功能 来 区 分 -ly 的 话 , 可 以 分 成 三 个 不 同 的 -ly 来 :一 个 只 能 
在 名 词 后 头 出 现 , 一 个 只 能 在 形容 词 后 头 出 现 ,一 个 只 能 在 动词 后 头 
出 现 ; 但 是 ,这 种 分 析 方 法 不 能 完全 反映 -ly 的 语法 作用 。 如 果 根 据 
x-ly 的 功能 来 区 分 -ly 的 话 , 可 以 分 出 两 个 不 同 的 -ly 来 :一 个 造成 形 
容 词 ,一 个 造成 副词 ;这 种 分 析 方法 能 够 反映 -ly 的 语法 作用 , 即 形容 
词 化 和 副词 化 。 传 统 语言 学 采用 的 是 后 一 种 方法 ,这 种 方法 的 实质 
是 把 带 -ly 的 格式 的 功能 上 的 异 或 同 归 结 为 -ly 的 功能 的 异 或 同 。 而 
《说 “的 ”》 的 根本 方法 就 是 把 带 “ 的 ”的 格式 在 功能 上 的 异 或 同 归 结 为 


@ 这 一 部 分 主要 参考 朱德 黑 先 生 纪念 文集 》 中 陆 俭 明 先生 的 《朱德 早先 生 在 汉语 
语法 研究 上 的 贡献 }》 等 文章 。 


朱德 黑 先 生 评 传 455 


“的 ”的 功能 的 异 或 同 。 从 中 ,我 们 固然 可 以 看 出 先生 的 雄辩 ,更 可 以 
领略 他 对 于 新 旧 两 种 分 析 方 法 的 内 在 联系 的 洞察 力 。 的 确 , 分 布 分 
析 这 种 描写 语言 学 的 新 方法 是 建 基于 传统 的 语法 分 析 方 法 之 上 的 ， 
是 对 传统 分 析 方 法 的 理论 化 、 程 序 化 。 事 实 上 ,分布 分 析 的 理论 前 提 
是 语言 构造 的 层次 性 ;因此 ,只 有 先 对 语言 形式 进行 层次 分 析 才 能 进 
一 步 对 其 中 的 某 些 语 法 形式 进行 分 布 分 析 。 朱 先生 在 《现代 汉语 形 
容 词 研究 》 中 就 磁 到 “ 白 的 纸 ? 应 该 二 分 (和 白 的 / 纸 ) 还 是 三 分 ( 白 /的 / 
纸 )“ 牌 戴 着 、 白 跑 了 ”该 怎样 切 分 (是 “ 牌 / 戴 着 、 白 / 跑 了 ?还 是 “ 牌 
戴 / 着 . 白 跑 / 了 ”) 等 问题 ,在 (说 “的 ”》 中 又 碰 到 “S 的 M? 应 该 二 分 (CS 
的 /M) 还 是 三 分 (S/ 的 /M) “ 真 的 、 善 的 .美的 东西 ?该 怎样 切 分 等 问 
题 。 但 是 ,当时 的 汉语 语法 研究 基本 上 是 在 传统 语法 的 框架 中 进行 
的 ,分 析 句 子 用 的 是 主 谓 宾 定 状 补 六 大 成 分 一 字 排 开 的 成 分 分 析 法 。 
为 了 扭转 这 种 局 面 , 先 生 在 1962 年 的 4 论 句 法 结构 兴 《 中 国语 文 汶 一 
9 月 号 ) 中 ,详细 地 论述 了 语法 构造 的 层次 性 ,介绍 了 层次 分 析 的 基 
本 的 操作 程序 ,说 明了 层次 分 析 对 于 分 化 歧义 结构 的 作用 ,给 当时 的 
汉语 语法 学 界 臂 头 猛 阅 了 一 场 及 时 两 。 

在 1961 年 的 4 说“ 的”》 中 , 朱 先 生 就 开始 尝试 变换 分 析 法 。 先 生 
用 这 种 动态 的 、 能 把 有 关 句 式 系 联 起 来 的 方法 ,来 证 明 “ 我 会 写 的 ”这 
类 结构 中 的 “的 ?是 名 词性 语法 单位 的 后 附 成 分 “的 ;”, 而 不 是 一 般 所 
谓 的 语气 词 。 在 1962 年 4 论 句法 结构 ?中 , 朱 先 生 专 辟 一 节 来 介绍 变 
换 分 析 ,并 以 汉语 实例 说 明 只 有 通过 变换 关系 才能 找 出 严格 意义 的 
同 构 格 式 来 一 一 因为 狭义 同 构 的 语法 形式 内 部 并 不 是 完全 一 致 的 ， 
这 种 不 一 致 性 可 以 从 它们 对 于 特定 的 变换 式 的 不 同 反映 上 看 出 来 。 
例如 : 


台 上 坐 着 主席 团 一 主席 团 坐 在 (得 ) 台 上 

台 上 唱 着 戏 一 类 戏 喝 在 (得 ) 台 上 
可 见 ,符合 狭义 同 构 条 件 的 格式 “处 所 词 十 动词 十 着 十 名 词 ? 并 不 是 
真正 的 同 构 。 在 以 后 发 表 的 文章 中 , 朱 先 生 更 为 广泛 和 娴熟 地 运用 
变换 分 析 方 法 来 分 析 一 些 利用 成 分 分 析 法 和 层次 分 析 法 所 无 法 处 理 
或 难以 解释 的 语法 现象 ,特别 是 歧义 现象 。 在 1986 年 的 4 变换 分 析 
的 平行 性 原则 》 兴 《中 国语 文 } 第 2 期) 中 ,先生 系统 地 总 结 了 变换 分 析 
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法 的 理论 原则 ,应 用 步骤 ,详细 地 盖 明 了 变换 式 撼 阵 里 的 句子 之 间 的 
四 种 平行 关系 。 不 仅 为 我 们 更 加 深入 地 分 析 汉 语 语法 、 巧 妙 地 揭示 
隐蔽 的 语法 规律 提供 了 新 的 方法 ,而 且 为 我 们 作出 了 怎样 使 用 变换 
分 析 法 的 指导 性 的 说 明 。 

在 1978 年 的 4“ 在 黑板 上 写字 ”及 相关 名 式 光 《语言 教学 与 研究 》 
试 刊 , 第 三 集 ) 中 , 朱 先 生 用 变换 分 析 法 来 分 化 一 类 同形 异 义 句 式 。 
例如 : 

黑板 上 写 着 字 一 〈 把 ) 字 写 在 黑板 上 
屋 里 开 着 会  # (把 ) 会 开 在 屋 里 

并 且 用 语义 特征 分 析 法 来 说 明 造 成 这 种 句 式 同形 异 义 的 原因 一 一 动 
词 “ 写 ?等 有 [5 十 状态 ]5 十 附着 ] 的 语义 特征 ,动词 “ 开 ( 会 )” 没 有 这 种 
语义 特征 。 后 来 ,先生 又 多 次 修改 这 篇 文章 ,不断 地 完善 语义 特征 分 
析 法 ;第 一 次 修改 稿 发 表 在 1981 年 的 《语言 教学 与 研究 沪 第 1 期 )， 
第 二 次 修改 稿 收入 论文 集 《 语 法 从 稿 % 上 海 教 育 出 版 社 ,1990 年 )。 
在 1979 年 的 与 动词 “给 ”相关 的 句法 问题 》(《 方 言 } 第 2 期) 中 , 朱 先 
生 继续 用 变换 分 析 法 分 化 跟 动 词 “ 给 ”相关 的 句 式 ,并 用 主要 动词 是 
否 包含 [十 给 予 ] 或 [十 取得 ] 等 语义 特征 来 作出 解释 。 如 果 说 ,变换 
分 析 法 为 分 化 同形 句 式 提供 了 可 操作 的 形式 程序 ;那么 可 以 说 ,语义 
特征 分 析 法 为 解释 同形 名 式 为 何 异 义 提供 了 直观 的 意义 根据 。 变 换 
分 析 和 语义 特征 分 析 的 配套 使 用 ,使 汉语 语法 研究 走 上 了 形式 和 意 
义 互 相 结合 、 互 相 渗透 、 互 相 验 证 的 道路 。 

朱德 四 先 生 不 仅 在 语法 研究 的 具体 方法 上 不 断 创新 ,而 且 在 研 
究 语言 的 观察 角度 和 宏观 思路 上 也 不 断 反思 、 锐 意 革新 。 他 在 1985 
年 为 桥 本 万 太郎 的 《语言 地 理 类 型 学 ?中 译本 所 写 的 序 中 ,一 方面 肯 
定 了 德 . 索 绪 尔 区 分 共 时 的 和 历时 的 语言 研究 方法 的 学 说 ,给 二 十 
世纪 的 语言 研究 带 来 的 深刻 的 积极 影响 ; 另 一 方面 也 明确 指出 这 种 
学 说 的 消极 影响 :把 对 语言 的 历史 研究 和 断代 描写 截然 分 开 , 看 成 是 
毫 不 相干 的 东西 。 朱 先生 批评 了 这 种 思潮 对 汉语 研究 的 消极 影响 : 
研究 现代 汉语 的 人 往往 只 研究 普通 话 ,不 但 不 关心 历史 ,而 且 把 方言 
研究 也 看 成 隔行 。 为 了 彻底 地 改变 这 种 风气 ,先生 身体 力行 ,将 共 时 
的 各 种 方言 (包括 北京 话 和 普通 话 ) 之 间 的 比较 研究 跟 历时 的 古今 汉 
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语 语法 之 间 的 比较 研究 结合 起 来 ,先后 对 “的 者 ` 所 、 之 ”等 虚词 、 重 
丢 式 象声词 反复 问 句 等 语法 问题 进行 了 跨越 方言 和 贯通 古今 的 对 
比 研 究 , 写 出 了 令 人 眼界 大 开 的 《北京 话 、 广 州 话 , 文 水 话 和 福州 话 里 
的 “的 ? 字 》《 自 指 和 转 指 一 一 汉语 名 词 化 标记 ”的 者、 所 、 之 ”的 语法 
功能 和 语义 功能 》《“ 的 ? 字 的 方言 比较 研究 》《 从 方言 和 历史 看 状态 
形容 词 的 名 词 化 兼 论 汉语 同位 性 偏 正 结构 》《 朝 阳 话 和 北京 话 重 麦 
式 象声词 的 构造 }《 方 言 1982 年 第 2 期 )《 汉 语 方言 里 的 两 种 反复 
问 句 》《“V-neg-VO" 与 “VO-neg-V” 两 种 反复 问 名 在 汉语 方言 里 的 
分 布 》。 这 一 系列 开创 性 的 研究 工作 ,为 汉语 语法 研究 开辟 了 一 条 贯 
通 共 时 和 历时 的 路 子 , 扩 大 了 我 们 的 视野 、 拓 宽 了 我 们 的 思路 ,并 使 
汉语 语法 研究 走 上 了 全 方位 、 多 视角 的 道路 。 

在 长 期 的 语法 研究 实践 中 ,朱德 辕 先 生 一 方面 仔细 观察 各 种 语 
言 事实 ` 深 入 挖掘 各 种 语言 现象 背后 隐藏 的 规律 ; 另 一 方面 努力 学 习 
各 种 先进 的 理论 .大 胆 尝 试 各 种 新 颖 的 方法 ,在 汉语 词类 划分 、 汉 语 
语法 的 特点 .汉语 语法 学 体系 .语法 成 分 之 间 的 结构 关系 .语法 结构 
之 间 的 关系 和 转换 过 程 等 方面 提出 了 一 系列 富有 创见 又 启 人 深思 的 
理论 观点 。 众 所 周知 ,由 于 汉语 没有 形态 变化 ,因而 汉语 到 底 有 没有 
词类 分 别 、. 如 果 有 那么 应 该 根据 什么 标准 来 划分 等 一 直 是 困扰 语法 
学 界 的 难题 。 早 在 50 年 代 , 朱 先生 已 经 明确 地 指出 : 我 认为 划分 词 
类 的 基本 根据 应 该 是 词 的 语法 功能 。…… 在 形态 丰富 的 语言 里 可 以 
根据 形态 划分 词类 ,…… 形 态 不 过 是 功能 的 标志 而 已 ” .9 在 八 十 年 
代 出 版 的 《语法 讲义 》 和 《语法 答 问 》 中 ,先生 坚持 并 发 展 了 这 种 观点 ， 
指出 ;汉语 不 像 印 欧 语 那样 有 丰富 的 形态 。 因 此 给 汉语 的 词 分 类 不 
能 根据 形态 ,只 能 根据 词 的 语法 功能 。…… 一 个 词 的 语法 功能 指 的 
是 这 个 词 在 句法 结构 里 所 能 占据 的 语法 位 置 *《 语 法 讲义 》8 2. 1) 。 
这 在 理论 上 为 汉语 词类 划分 工作 提供 了 指导 性 的 原则 。 在 《语法 答 
问 》 中 , 朱 先 生 对 比 了 汉语 和 英语 等 印 欧 语 言 的 主要 差别 ,指出 由 于 


@ 详 见 (北京 大 学 1959 年 五 四 科学 讨论 会 讨论 汉语 实 词 分 类 问题 的 报告 和 发 言 》 
中 朱德 辕 先 生 的 发 言 《语言 学 论 丛 } 第 四 辑 , 上 海 教育 出 版 社 ,1960 年 。 又 4 朱德 论文 集 》 
第 2 卷 , 商 务 印 书馆 ,1999 年 。 
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汉语 缺乏 形态 变化 ,造成 汉语 语法 有 两 大 特点 :(i) 汉 语词 类 跟 句 法 
成 分 之 间 不 存在 简单 的 一 一 对 应 的 关系 ,而 是 呈现 出 一 对 多 、 多 对 
一 `\ 多 对 多 等 错综复杂 的 对 应 关系 ,进而 指出 词类 转化 、. 词 无 定 类 学 
说 的 错误 根源 在 于 没 能 认识 汉语 词类 的 多 功能 性 ; (ii) 汉 语句 子 的 
构造 原则 跟 词 组 的 构造 原则 基本 上 是 一 致 的 ,不 像 英语 那样 句子 和 
子 句 是 一 套 构造 原则 .词组 是 另 一 套 构 造 原 则 ,因此 可 以 在 词组 的 基 
础 上 来 描写 汉语 句法、 建立 一 种 以 词组 为 基点 (本 位 ) 的 语法 体系 。 
在 1980 年 发 表 的 4 汉语 句法 里 的 歧义 现象 》《 中 国语 文 ;第 2 期 ) 中 ， 
先生 在 讨论 多 义 句 式 的 分 化 依据 时 ,明确 地 指出 句法 成 分 之 间 有 两 
种 不 同 的 语法 关系 :一 种 是 显 性 的 语法 关系 ,比如 主 谓 、 述 宾 、 偏 正 等 
结构 关系 ;一 种 是 隐 性 的 语法 关系 ,比如 动作 和 施 事 、 受 事 `、 工 具 等 语 
义 关 系 。 区 分 这 两 种 语法 关系 ,为 解决 汉语 主语 、 宾 语 的 区 分 和 界定 
提供 了 理论 指导 。 在 句法 结构 的 类 型 上 ,先生 在 《语法 讲义 》 中 开创 
性 地 区 分 出 粘 合 式 和 组 合式 两 种 结构 类 型 : 粘 合式 结构 的 组 成 成 分 
都 是 单个 的 词 ,整个 结构 在 功能 上 相当 于 一 个 词 ; 组 合式 结构 的 组 成 
成 分 一 般 不 是 单个 的 词 , 其 中 的 结构 成 分 之 间 关 系 比 较 松 散 。 建 立 
了 粘 合 、 组 合 的 概念 ,可 以 更 好 地 概括 一 些 语法 现象 解释 一 些 语法 
规律 ,比如 多 项 定语 的 顺序 .哪些 述 宾 结 构 可 以 直接 作 名 词 的 定语 等 
问题 。 在 1982 年 的 《语法 讲义 》 中 ,先生 提出 了 指称 和 陈述 两 个 新 概 
念 。 指 称 就 是 名 词性 成 分 在 意念 指 谓 事 物 ,指称 形式 可 以 用 “什么 ” 
来 指 代 ;陈述 就 是 动词 性 成 分 在 意念 上 指 谓 事 件 或 状态 等 ,陈述 形式 
可 以 用 怎么 样 " 来 指 代 。 在 《 自 指 和 转 指 》 一 文中 ,先生 系统 地 用 这 
两 个 概念 来 说 明 不 同 的 句法 结构 之 间 的 转化 关系 :的 ?加 在 动词 性 
成 分 ( 记 作 VP) 之 后 ,原来 表示 陈述 的 VP 就 转化 成 表示 指称 的 *VP 
的 > 了。 比如 : 
[小 王 ] 开 车 一 开车 的 (一 小 王 ) 
小 孩 画 [ 画 儿 ]-> 小 孩 画 的 (一 画 儿 ) 

在 讨论 陈述 形式 向 指称 形式 转换 ( 即 名 词 化 ) 的 时 候 , 先 生 十 分 娴熟 
地 运用 了 国外 语言 学 理论 中 的 句法 缺 位 和 成 分 提取 等 概念 ,用 以 说 
明 名 词 化 的 指称 形式 在 语义 上 有 自 指 和 转 指 两 种 情况 。 其 中 , 自 指 
是 名 词 化 造成 的 指称 形式 跟 原 来 的 动词 性 成 分 所 指 相 同 , 比 如 “( 小 
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王 ) 开 车 的 技术 ”中 “小 王 ) 开 车 的 ? 跟 *( 小 王 ) 开 车 ”所 指 一 样 ; 转 指 
是 名 词 化 造成 的 指称 形式 跟 原 来 的 动词 性 成 分 所 指 不 同 , 比 如 “5 
开车 的 (人 ) "中 “5 ] 开 车 的 ? 跟 “5C ] 开 车 ”所 指 不 同 。 先 生 十 分 敏锐 
地 指出 , 自 指 的 名 词 化 形式 中 可 以 有 也 可 以 没有 缺 位 , 转 指 的 名 词 
化 形式 中 一 定 没有 缺 位 。 这 为 我 们 进一步 研究 汉语 句法 结构 之 间 的 
转换 关系 、 研 究 “ 的 者 所、 之 ”等 虚词 的 句法 功能 和 语义 功能 提供 了 
合用 的 理论 概念 和 分 析 方法 。 值 得 一 提 的 是 ,在 1978 年 的 4“ 的 ” 字 
结构 和 判断 句 》 中 ,先生 首次 明确 地 提出 汉语 动词 “向 ”的 观念 ,并 用 
以 解释 的” 字 结 构 的 歧义 指数 ;这 一 方面 为 我 们 研究 歧义 现象 .描写 
句子 成 分 之 间 的 支配 和 从 属 关系 提供 了 新 的 角度 和 工具 , 另 一 方面 
直接 推动 了 汉语 配 价 语法 的 莲 勃 展开 。 

因此 ,我 们 十 分 赞同 陆 俭 明 先生 的 评论 :朱德 店 先 生 是 我 国 思想 
最 活 牙 、 最 富有 创新 精神 的 语法 学 家 之 一 ,是 汉语 语法 研究 的 带头 人 
和 领路 人 人。 


4 一 生 钟 情 古 文字 ” 探 唤 发 微 结 硕果 ” 


朱德 四 先 生 在 大 学 期 间 就 对 古文 字 产 生 了 浓厚 的 兴趣 ,课余 时 
间 专 心 攻读 《说 文 解 字 》 用 的 本 子 是 扫 叶 山 房 石 印 的 段 玉 裁 4( 说 文 
解 字 ? 注 》, 经 常 跟 李 荣 先 生 等 同学 讨论 说 文 。 他 还 听 了 唐 兰 先生 讲 
的 《说 文 解 字 》 和 《古文 字 学 ?两 门 课 , 毕 业 论文 的 选 题 就 是 关于 甲骨 
文 研究 方面 的 ,并 被 闻 一 多 教授 亲自 批 为 甲 等 。 自 1947 年 到 1948 
年 , 朱 先 生 在 北平 《新生 报 ;的 语言 与 文学 版 上 连续 发 表 《 读 古文 字 小 
记 》(2 篇 ) 和 《 楚 器 研究 》(3 篇 ) 等 考释 古文 字 的 文章 。 其 中 ,关于 战 
国 楚 器 铭文 的 几 篇 ,后 来 改写 成 《 寿 县 出 土 楚 器 铭文 研究 ?发 表 在 郭 
沫 若 先生 主编 的 4 历史 研究 》 创 刊 号 (1954 年 第 1 期)。 在 这 篇 文章 
中 , 朱 先 生 通 过 细密 的 论证 ,考释 出 写法 奇 诡 的 “ 佳 ” 字 和 当时 许多 人 


@ 详 见 陆 俭 明 《朱德 黑 先 生 在 汉语 语法 研究 上 的 贡献 , 见 ( 朱 德 辕 先 生 纪 念 文集 》 
@ 这 一 部 分 主要 参考 (朱德 早先 生 纪 念 文集 》 中 李 学 勤 先生 的 《朱德 辕 先生 战 国文 
字 研 究 的 贡献 》 故 锡 圭 先 生 的 《朱德 四 先生 在 古文 字 学 方面 的 贡献 } 等 文章 。 
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不 能 办 识 的 从 “ 佳 ” 的 “ 集 ” 字 ,并 很 快 就 得 到 了 普遍 承认 。 另 外 ,文章 
把 楚 器 铭文 中 的 “ 王 句 ? 和 古 印 中 的 “ 夫 句 ” 释 读 为 “王后 ”和 “太后 ”， 
这 些 都 是 很 好 的 见解 。 这 些 文章 的 水 平 都 明显 超过 以 往 对 寿 县 李 三 
孤 堆 铭文 的 考释 ,当时 便 引起 了 学 术 界 的 广泛 注意 。1858 年 , 朱 先 
生 又 在 北京 大 学 中 文系 编辑 的 《语言 学 论 丛 》 第 二 辑 上 发 表 《 战 国 记 
容器 刻 辞 考释 四 篇 》, 提 出 了 不 少 很 好 的 意见 。 正 是 这 两 篇 文章 呐 定 
了 朱 先 生 在 战国 文字 研究 领域 中 的 突出 地 位 。 

到 了 60 年 代 , 尽 管 当 时 的 政治 形势 不 利于 学 术 研 究 , 但 是 朱 先 
生 由 于 对 古文 字 有 发 自 内 心 的 爱好 ,并 没有 中 止 这 方面 的 研究 。 在 
70 年 代 , 先 生 参 加 了 马 王 堆 1 号 汉 墓 遗 册 、 银 淮山 汉 墓 竹 书 、 马 王 堆 
3 号 汉 幕 息 书 、 望 山 楚 墓 竹简 和 平山 中 山王 墓 铜 器 铭文 的 整理 研究 
工作 ,作出 了 很 大 的 贡献 。 同 时 , 朱 先 生 在 《文物 兴 考 古 学 报 闪 古 文 
字 研 究 兴 方言 上 发 表 了 多 篇 考释 战国 文字 的 论文 ,涉及 的 资料 包括 
楚 简 、 楚 外 书 、 笨 印 、 陶 文 . 盟 书 和 铜 器 铭文 等 方面 ,提出 了 一 些 极为 
精辟 的 考释 结论 ,并 为 学 者 们 所 普遍 接受 。 

战国 文字 是 很 难 研 究 的 ,因为 战国 时 代 “ 言 语 异 声 , 文 字 异 形 ” 
(说 文 。 氢 ) ,又 是 文字 剧烈 变化 的 一 个 时 代 。 秦 灭 六 国 以 后 ， 罢 其 
不 与 秦 文 合 者 ”( 说 文 。 氢 ) ,使 得 汉代 的 人 已 难以 辨识 。 并 且 , 战 国 
文字 里 的 很 多 字 跟 各 种 古文 字 里 相 应 的 字 ,在 字形 上 几乎 完全 失去 
了 联系 , 令 许 多 学 者 望而却步 。 历 代 学 者 解释 系 印 、 货 币 等 战国 文 
字 , 有 好 多 误解 ;而 且 这 些 误 释 流传 甚 广 , 几 乎 成 了 公认 的 说 法 。 朱 
先生 的 不 少 研究 就 是 针对 传统 误 释 的 ,他 在 占有 大 量 材料 的 基础 上 
作出 周密 的 论证 ,其 结果 往往 出 人 意 表 但 又 令 人 信服 。 因 为 先生 善 
于 深入 细致 地 分 析 字 形 ,精确 地 揭示 该 字 的 形体 演变 的 复杂 过 程 , 使 
人 看 清 这 一 字形 就 是 该 字 的 异体 。 

朱 先 生 研 究 古 文字 还 有 一 个 特点 ,就 是 善于 把 语言 学 的 方法 运 
用 到 古文 字 学 的 研究 上 来 。 先 生 坚持 语言 学 的 观点 ,非常 注意 文 例 ; 
不 但 要 求 自己 的 考释 在 字形 上 站 得 住 脚 ,而 且 要 求 在 语法 .语义 上 也 
站 得 住 脚 。 他 时 常 根据 一 个 古文 字 在 语句 中 的 语法 地 位 ,来 判断 它 
有 可 能 是 哪个 字 或 不 可 能 是 哪个 字 。 由 于 朱 先 生 具 有 上 述 优点 ,加 
上 他 的 文章 语言 简练 .条 理 清 楚 、 分 析 透 彻 ,因而 他 的 考释 文章 给 人 


朱德 四 先 生 评 传 461 


耳目 一 新 的 感 党 。 正 是 由 于 他 和 故 锡 圭 先 生 在 70 年 代 以 后 的 合作 ， 
共同 促进 了 战国 文字 的 研究 ,并 使 战国 文字 研究 成 为 中 国 古 文字 学 
的 一 个 独立 的 分 支 。 

朱德 品 先生 毕生 热爱 古文 字 , 那 是 一 种 发 自 内 心 的 ,情不自禁 的 
挚爱 。 有 两 件 小 事 或 许可 以 为 证 :1975 年 ,先生 在 文物 出 版 社 整 理 
湖南 长 沙 马 王 堆 出 土 的 竹简 ;这 时 , 恰 估 先 生 的 外 孙女 降生 ,他 就 兴 
致 勃勃 地 给 外 孙女 起 了 个 单 名 “ 简 ”;9 在 先生 晚年 ,有 人 问 他 : 在 语 
法 和 古文 字 两 头 ,您 哪 方 面 成 就 更 大 一 点 ?先生 沉吟 片刻 , 笑 着 说 : 
“大 概 差不多 吧 ”含糊 的 回答 ,实在 是 一 种 真情 的 流露 。 


5s 哲人 已 骑 黄 稚 去 ” 薪 火 能 能 有 传人 


朱德 中 先 生 离 开 了 我 们 , 带 着 他 的 遗憾 、 带 着 他 的 未 竞 之 作 、 带 
着 他 那 远大 的 学 术 抱 负 、 带 着 他 那 过 人 的 才智 和 广博 的 学 识 ;但 是 ， 
朱 先 生 的 学 术 思 想 留 给 了 我 们 、 朱 先生 的 创新 精神 留 给 了 我 们 。 令 
人 欣慰 的 是 ,直接 或 间接 地 受过 朱 先 生 教 诲 和 学 术 影响 的 学 者 ,他 们 
散布 在 祖国 各 地 、 帮 至 世界 各 地 ;他 们 正在 以 不 同 的 方式 发 扬 先 生 开 
创 的 学 术 思 想 ,努力 把 汉语 语言 学 的 研究 推进 到 一 个 更 高 的 水 平 。 
在 朱 先 生生 前 工作 的 北京 大 学 中 文系 ,在 现代 汉语 语法 ` 近 代 汉 语 语 
法 方言 语法 古文字 等 先生 热爱 的 研究 领域 , 均 有 实力 比较 雄厚 的 
研究 队伍 ,并 形成 老 中 青 三 代 井 然 有 序 的 学 术 梯 队 , 先 生 开创 的 学 术 
事业 可 以 说 是 后 炙 有 人 、 并 必 将 更 加 莲 勃 地 发 展 。 


( 原 载 袁 航 林 编 人 《朱德 品 选 集 》, 东 北 师 范 大 学 出 版 社 ,2001 年 ) 


@ 详 见 (朱德 黑 先 生 纪念 文集 》 中 朱 训 的 《我们 想念 你 ,爸爸 》, 第 67 页 。 


后 记 


收入 本 书 的 18 篇 文章 ,都 是 我 在 90 年 代 中 期 以 后 陆续 写成 的 。 
其 中 ,大 部 分 是 作为 教育 部 “十 五 科研 规划 第 一 批 ( 博 士 点 基金 ) 项 
目 ” 一 一 “面向 信息 抽取 的 语义 标注 研究 ”的 子 课题 ,而 陆续 完成 的 
(项 目 批准 号 : 01JB740006) 。 现 在 ,我 把 它们 收集 在 一 起 ,根据 文章 
的 内 容 , 大 致 分 成 4 编 , 以 便 读者 阅读 。 在 这 里 ,我 要 感谢 教育 部 给 
我 提供 这 笔 基金 ,使 我 能 够 在 一 个 比较 优越 的 环境 中 进行 研究 从容 
地 写作 。 我 还 要 感谢 北京 大 学 社会 科学 研究 部 提供 了 相应 的 配套 经 
费 ,使 我 的 研究 有 了 比较 充分 的 物质 保障 。 虽 然 加 在 一 起 的 资金 并 
不 多 ,但 是 足以 让 我 感受 到 我 们 这 一 代 学 者 的 幸运 ,能 够 享受 改革 开 
放 带 来 的 伟大 成 果 。 这 也 促使 我 知 恩 图 报 , 努 力 在 自己 所 从 事 的 专 
业 领 域 中 作出 成 绩 , 尽 可 能 让 自己 的 研究 多 少 带 有 一 点 技术 色彩 , 希 
望 为 国家 的 经 济 建设 献 出 一 点 绵薄 之 力 。 

大 家 知道 ,计算 语言 学 的 研究 有 不 同 的 思路 (approach); 而 这 跟 
不 同 的 研究 者 对 这 门 学 科 的 理解 ,特别 是 他 们 的 研究 取向 (orienta- 
tion) 和 知识 背景 有 关 。 我 比较 喜欢 那 种 对 于 语言 研究 和 自然 语言 
的 计算 机 处 理 两 头 都 有 启发 性 的 路 子 , 于 是 免不了 要 走 认 知 主义 的 
道路 ,并 坚持 认 知 的 本 质 是 计算 的 观念 ;在 此 基础 上 ,逐步 形成 基于 
认 知 并 面向 计算 的 语言 研究 的 路 子 。 当 然 , 我 不 反对 其 他 路 子 的 计 
算 语言 学 研究 。 这 反 过 来 也 可 以 解释 ,为 什么 我 对 语言 的 认 知 研究 
跟 一 般 的 认 知 语言 学 或 认 知 语法 会 如 此 大 蜡 其 趣 。 

在 学 习 和 研究 计算 语言 学 的 过 程 中 ,我 先后 得 到 黄 昌 宁 、 罗 振 声 
和 董 振 东 等 老师 的 帮助 和 鼓励 ; 跟 白 硕 、 王 培 、 金 茂 兵 . 孙 藏 松 、 周 明 、 
姬 东 鸿 和 周强 等 学 友 的 讨论 ,也 使 我 大 开眼 界 。 特 别 是 陆 俭 明 老 师 
鼓励 我 于 1998 年 给 研究 生 开设 《计算 语言 学 ?课程 ,促使 我 对 计算 语 
言 学 的 各 种 研究 路 子 和 教材 体系 作 了 系统 的 梳理 。 在 此 ,说 向 他 们 
表示 诚挚 的 谢意 。 
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在 这 些 文章 的 写作 和 修改 过 程 中 ,先后 得 到 陆 俭 明 老 师 和 顾 阳 、 
郭 锐 、 沈 培 , 久 卫 东 、 徐 刚 等 学 友 的 帮助 和 指正 ,还 得 到 方 梅 . 刘 丹青 、 
张 旺 熹 .新 光 瑾 . 叶 青 和 申 坚 等 先生 的 指正 ;其 中 (走向 多 层面 互动 的 
汉语 研究 ) 一 文 是 在 日 本 讲学 期 间 写 成 的 ,承蒙 东京 大 学 的 柯 理 思 教 
授 、 御 茶 之 水 女子 大 学 的 相 原 茂 教授 和 森 中 野 枝 助手 提供 诸多 资料 
上 的 帮助 。 在 此 ,说 向 他 们 表示 诚挚 的 谢意 。 在 这 里 ,我 特别 要 感谢 
《中 文 信息 学 报 》 编 辑 部 的 曹 右 琦 等 老师 和 多 位 匿名 评审 老师 ; 正 是 
他 们 的 鼓励 和 帮助 ,使 我 的 三 篇 文章 能 够 在 (中 文 信息 学 报 》 上 发 表 ， 
可 以 直接 向 中 文 信息 处 理 界 的 广大 人 士 请 教 。 

最 后 ,我 要 感谢 陆 俭 明 老师 对 我 的 关心 和 教诲 ;感谢 他 在 百 忙 之 
中 拨 元 作 序 ,鼓励 有 加 。 感 谢 冯 志 伟 老师 对 我 的 关心 和 鼓励 ,并 欣然 
答应 作 序 。 感 谢 同 事 钴 卫 东 先生 在 该 课题 的 申报 、 文 章 中 逻辑 公式 
的 推敲 .一 直到 图 表 处 理 等 诸多 方面 提供 的 大 量 帮 助 。 我 还 要 感谢 
北京 大 学 出 版 社 的 热情 支持 。 

由 于 收入 本 书 的 各 篇 文章 是 在 不 同时 期 和 不 同 的 地 点 写成 的 ， 
因而 所 引文 献 的 版 本 、 行 文 的 格式 体例 .所 用 的 术语 乃至 观点 可 能 前 
后 不 一 ,现在 也 难以 全 部 统一 ;说 此 ,向 广大 读者 致 娄 。 书 中 的 廖 误 
和 丝 漏 , 敬 请 各 位 读者 和 行家 不 音 指正 。 


2007 年 金秋 于 北京 蓝 旗 营 


